[tintuc]

YouTuber PewDiePie tự huấn luyện AI, từng tuyên bố vượt GPT-4 rồi phải hủy kết quả vì “nhiễm” benchmark

PewDiePie tự fine-tune AI để cải thiện khả năng lập trình

Streamer nổi tiếng PewDiePie vừa chia sẻ hành trình nhiều tháng tự huấn luyện một mô hình AI với mục tiêu nâng cao khả năng lập trình. Thay vì xây dựng từ đầu, anh lựa chọn fine-tune mô hình có sẵn là Qwen 2.5 phiên bản 32B.

Anh nhấn mạnh mục tiêu chính không phải cạnh tranh thương mại, mà để hiểu sâu hơn về quy trình huấn luyện AI và cách các mô hình lớn được tối ưu hóa.

Benchmark Aider Polyglot và tuyên bố “vượt GPT-4”

Bài kiểm tra PewDiePie sử dụng là Aider Polyglot, một benchmark đánh giá năng lực lập trình đa ngôn ngữ.

Theo chia sẻ:

Các mô hình như DeepSeek 2.5 và Llama 4 Maverick đạt khoảng hơn 18% (diff format).
Mô hình ban đầu của anh chỉ đạt 8%, sau khi đổi định dạng tăng lên 16%.

Sau quá trình bổ sung khoảng 100.000 mẫu dữ liệu (kết hợp dữ liệu công khai, GitHub và dữ liệu tổng hợp từ AI mạnh hơn), anh tiếp tục fine-tune thêm 15.000 mẫu có phần “reasoning” – yêu cầu mô hình giải thích từng bước trước khi đưa ra đáp án.

Ở một lần chạy benchmark, mô hình đạt 19,6%. PewDiePie tuyên bố đã vượt GPT-4 (mốc tháng 11).

Tuy nhiên, sau đó anh phát hiện hiện tượng benchmark contamination – dữ liệu huấn luyện bị trùng với câu hỏi trong bộ test. Kết quả này lập tức bị hủy bỏ.

Huấn luyện lại từ đầu và cú “quay xe” ngoạn mục

Sau khi rà soát, PewDiePie phát hiện:

Từng fine-tune nhầm bản thường thay vì bản coder chuyên biệt của Qwen 2.5
Bộ benchmark chưa chạy đầy đủ C++ và JavaScript
Có lỗi trong quy trình kiểm thử

Khi chuyển sang bản coder chuyên dụng, điểm số ban đầu giảm mạnh xuống 4,4%. Sau nhiều lần tối ưu lại:

Tăng lên 25%
Sửa lỗi benchmark đạt 36%
Hậu huấn luyện thêm 1.500 mẫu trong 5 epoch
Điểm cuối cùng đạt 39,1%

Dù vậy, khi Qwen 3 ra mắt với mức khoảng 40% trên cùng benchmark, mô hình của anh lại tiếp tục bị “soán ngôi”.

Sự cố phần cứng: cháy dây nguồn, hỏng GPU

Quá trình huấn luyện không hề suôn sẻ. PewDiePie tiết lộ:

Hệ thống tiêu thụ hơn 2.000W
Làm cháy dây nguồn
Một GPU bị hỏng
Máy tính tự lắp ghép liên tục gặp lỗi

Điều này cho thấy việc huấn luyện mô hình AI lớn đòi hỏi hạ tầng phần cứng cực kỳ ổn định và tốn kém.

Bài học rút ra: Điểm benchmark không nói lên tất cả

PewDiePie thừa nhận rằng đạt điểm cao ở một benchmark không đồng nghĩa với năng lực toàn diện. Anh cho biết cần kiểm tra thêm trên các bộ test khác như SWE-bench trước khi cân nhắc công bố mô hình.

Với anh, dự án này là hành trình học hỏi thông qua thử nghiệm và thất bại, hơn là nỗ lực cạnh tranh trực tiếp với các công ty AI lớn.

[/tintuc]

Cảm Nhận Khách Hàng

"chủ sốp dễ thương, tư vấn nhiệt tình, tài khoản bị gì là bao đổi trả. Nói chung là uy tín."

- Huỳnh Nguyễn Như Quỳnh

"Đã mua adobe 100gb sử dụng nhiều lần. Sử dụng rất ổn định chưa bị lỗi bao giờ ."

- Nguyễn Vũ

"Sản phẩm giá rẻ mà chất lượng rất ổn định, rất ít khi gặp lỗi. Hỗ trợ rất nhanh chóng."

- Mai Lan

"Mua về dùng thấy sản phẩm ok, không bị lỗi gì và tốc độ xử lý rất nhanh."

- Minh Anh

"Chất lượng rất tốt, giá cả hợp lý. Mỗi lần gặp vấn đề đều được khắc phục ngay lập tức."

- Hương Giang

"Mua về xài rất ổn, không gặp lỗi gì cả. Sản phẩm đúng như mô tả, nhanh chóng và dễ sử dụng."

- Thảo Vân

"Rất hài lòng với sản phẩm. Chất lượng ổn định, khi có vấn đề thì được hỗ trợ cực kỳ nhanh chóng."

- Phương Linh

"Tuyệt vời! Dịch vụ chuyên nghiệp, sản phẩm chất lượng cao. Sẽ giới thiệu cho bạn bè."

- Nguyễn Thị Hoa

"Đã mua nhiều lần, lần nào cũng hài lòng. Shop uy tín, giao hàng nhanh, giá cả phải chăng."

- Trần Minh Tuấn

"Chất lượng sản phẩm tốt, giá cả hợp lý. Đội ngũ hỗ trợ nhiệt tình và chuyên nghiệp."

- Lê Thị Mai

"Tuyệt vời! Sản phẩm hoạt động ổn định, không gặp lỗi gì. Sẽ tiếp tục ủng hộ shop."

- Hoàng Văn Nam

"Rất hài lòng với dịch vụ. Sản phẩm chất lượng, giá cả hợp lý, hỗ trợ nhanh chóng."

- Võ Thị Lan

"Shop rất uy tín, sản phẩm đúng như mô tả. Đã mua nhiều lần và luôn hài lòng."

- Phạm Đức Anh

"Chất lượng tuyệt vời, giá cả phải chăng. Sẽ giới thiệu cho bạn bè và gia đình."

- Nguyễn Thị Thu

"Tuyệt vời! Sản phẩm hoạt động ổn định, không gặp lỗi gì. Hỗ trợ khách hàng rất tốt."

- Đặng Văn Hùng

"Rất hài lòng với dịch vụ. Sản phẩm chất lượng cao, giá cả hợp lý. Sẽ tiếp tục ủng hộ."

- Bùi Thị Hương

❮ ❯

YouTuber PewDiePie tự huấn luyện AI

YouTuber PewDiePie tự huấn luyện AI, từng tuyên bố vượt GPT-4 rồi phải hủy kết quả vì “nhiễm” benchmark

PewDiePie tự fine-tune AI để cải thiện khả năng lập trình

Benchmark Aider Polyglot và tuyên bố “vượt GPT-4”

Huấn luyện lại từ đầu và cú “quay xe” ngoạn mục

Sự cố phần cứng: cháy dây nguồn, hỏng GPU

Bài học rút ra: Điểm benchmark không nói lên tất cả

[/tintuc]

Thông tin về Kho App Việt

Liên kết

Chính sách

Fanpage

Phương thức thanh toán

Đăng ký nhận tin

YouTuber PewDiePie tự huấn luyện AI

YouTuber PewDiePie tự huấn luyện AI, từng tuyên bố vượt GPT-4 rồi phải hủy kết quả vì “nhiễm” benchmark

PewDiePie tự fine-tune AI để cải thiện khả năng lập trình

Benchmark Aider Polyglot và tuyên bố “vượt GPT-4”

Huấn luyện lại từ đầu và cú “quay xe” ngoạn mục

Sự cố phần cứng: cháy dây nguồn, hỏng GPU

Bài học rút ra: Điểm benchmark không nói lên tất cả

[/tintuc]

Liên quan

Cảm Nhận Khách Hàng