【nhận định bóng đá hàn quốc hôm nay】Trung Quốc ra mắt AI chuyên toán, mục tiêu vượt ChatGPT và Gemini
Mô hình ngôn ngữ lớn Qwen2-Math được phát triển bởi Alibaba dự kiến giúp giải quyết các bài toán phức tạp.
Alibaba đang hướng đến mục tiêu nâng cao tiêu chuẩn trong phát triển AI bằng cách ra mắt nhóm các mô hình ngôn ngữ lớn (LLM) dành riêng cho lĩnh vực toán học có tên là Qwen2-Math. TheốcramắtAIchuyêntoánmụctiêuvượtChatGPTvànhận định bóng đá hàn quốc hôm nayo gã khổng lồ thương mại điện tử, mô hình này có thể vượt trội khả năng của GPT-4o.
"Trong năm qua, chúng tôi đã dành nhiều nỗ lực đáng kể để nghiên cứu và nâng cao khả năng lập luận của các mô hình ngôn ngữ lớn, đặc biệt tập trung vào khả năng giải quyết các bài toán số học", nhóm Qwen, chia sẻ trên nền tảng dành cho nhà phát triển GitHub mới đây.
Các mô hình ngôn ngữ lớn của Alibaba được phát hành vào tháng 6. Các mô hình này có 3 phiên bản, khác nhau về số lượng tham số mà chúng sử dụng. Tham số là các biến giúp AI học cách tạo ra đầu ra chính xác từ dữ liệu đã cho.
Theo bài đăng của nhóm Qwen, mô hình có số lượng tham số lớn nhất, Qwen2-Math-72B-Instruct đã vượt trội hơn các LLM độc quyền do Mỹ phát triển trong các bài đo năng lực toán học. Những LLM đó bao gồm GPT-4o, Claude 3.5 Sonnet của Anthropic, Gemini 1.5 Pro của Google và Llama-3.1-405B của Meta Platforms.
Nhóm phát triển cho biết "Chúng tôi hy vọng rằng Qwen2-Math có thể đóng góp cho cộng đồng trong việc giải quyết các vấn đề toán học phức tạp".
Theo bài đăng, các mô hình AI Qwen2-Math đã được thử nghiệm trên cả chuẩn toán tiếng Anh và tiếng Trung. Trong đó bao gồm GSM8K - một tập dữ liệu gồm 8.500 bài toán tiểu học đa dạng về mặt ngôn ngữ nâng cao; OlympiadBench - một chuẩn khoa học đa phương thức song ngữ cấp cao; và cao khảo, kỳ thi tuyển sinh đại học khó nhằn của Trung Quốc.
Vào tháng 7, Qwen2-72B-Instruct chỉ đứng sau GPT-4o và Claude 3.5 Sonnet trong bảng xếp hạng LLM từ SuperClue, một nền tảng đánh giá mô hình dựa trên các tham số như năng lực tính toán, suy luận logic, mã hóa và hiểu văn bản, cùng nhiều tham số khác.
Theo SuperClue, khoảng cách giữa các mô hình AI của Trung Quốc và Hoa Kỳ dường như đang thu hẹp lại, và cho biết Trung Quốc đã đạt được tiến bộ đáng kể trong việc phát triển LLM nội địa nửa đầu năm nay.
Một bài kiểm tra riêng được công bố vào tháng 7 bởi LMSYS - một tổ chức nghiên cứu mô hình AI được hỗ trợ bởi Đại học California, Berkeley - cho thấy Qwen2-72B được xếp hạng 20, trong khi các mô hình độc quyền từ OpenAI, Anthropic và Google chiếm hầu hết các vị trí trong top 10.
Thạch Anh(Nguồn: SCMP)(责任编辑:Nhà cái uy tín)
- Hà Tĩnh: Án mạng ở trung tâm thương mại, một người nước ngoài tử vong
- Thị trường bán dẫn Việt Nam dự kiến đạt 7,01 tỷ USD vào năm 2028
- Mẹo xóa cùng lúc nhiều danh bạ trên iPhone
- Cơ hội chiêm ngưỡng mưa sao băng Taurids rực sáng bầu trời đêm nay
- Mức sinh giảm sâu: Hệ lụy và lời giải từ chính sách
- SHB được chấp thuận tăng vốn điều lệ lên 40.658 tỷ đồng qua phát hành cổ phiếu trả cổ tức
- Hội nghị Quốc tế Techsauce 2024: Hướng đến thúc đẩy nền kinh tế số bền vững
- Chọn độ phân giải camera an ninh sao cho phù hợp
- Cách kéo dài tuổi thọ máy tính xách tay
- 'Nhường chỗ' cho hồ chứa nước Ka Pét, rừng được khai thác và trồng mới thế nào?
- Có nên bật/tắt TV trực tiếp từ ổ cắm điện?
- Thị trường bán dẫn Việt Nam dự kiến đạt 7,01 tỷ USD vào năm 2028
- Mac mini M4 với nút nguồn vô lý dưới đáy lần đầu được 'minh oan'
-
Bí thư Lào Cai chỉ đạo khắc phục vụ vỡ cống tràn xả thải
Sáng 9/8, Bí thư Tỉnh uỷ Lào Cai Đặng Xuân Phong đến hiện trường vụ vỡ cố ...[详细] -
Chọn độ phân giải camera an ninh sao cho phù hợp
(VTC News) - Độ phân giải không chỉ ảnh hưởng trực tiếp đến chất lượng hình ảnh mà còn tác động đến ...[详细] -
Chiếm quyền điều khiển điện thoại bằng cách lừa đảo đổi tem đăng kiểm trực tuyến
(VTC News) - Các đối tượng lừa đảo dùng hình thức yêu cầu người dân hoặc doanh nghiệp đổi tem kiểm đ ...[详细] -
Công ty Nhật biến mọi bề mặt thành cảm ứng, kể cả thú nhồi bông
(VTC News) - Công nghệ này được trình làng tại triển lãm công nghệ CEATEC, Nhật Bản.Japan Display In ...[详细] -
Bộ GTVT nói không với đề nghị trông giữ xe dưới gầm cầu cạn ở Hà Nội
Cụ thể, Bộ GTVT cho biết, căn cứ quy định của pháp luật về giao thông đường bộ, b&atild ...[详细] -
Vì sao tốc độ sạc điện thoại Android bỗng nhiên chậm?
(VTC News) - Một vấn đề thường gặp mà người dùng Android đối mặt là tốc độ sạc bỗng nhiên chậm lại.V ...[详细] -
Mô hình Soihub kỳ vọng thu hút phát triển công nghệ xanh
(VTC News) - Mô hình Trung tâm đổi mới sáng tạo mở (Soihub) được kỳ vọng thu hút các tập đoàn lớn cù ...[详细] -
Cận cảnh vệ tinh Starlink tái nhập Trái đất, nổ tung như pháo hoa
(VTC News) - Vệ tinh Starlink của SpaceX được thiết kế để tái nhập Trái đất khi kết thúc nhiệm vụ nh ...[详细] -
Va chạm với xe tải, ô tô con ở Thanh Hóa biến dạng
Vụ tai nạn xảy ra vào khoảng 16h30’ ngày 13/8 trên tuyến đường liên ...[详细] -
Tính năng đột phá giúp tạo ra mạng 6G có tốc độ đáng kinh ngạc
Mặc dù 5G chỉ mới được triển khai gần đây nhưng các nhà nghiên cứu đã bắt đầu phát triển mạng 6G thế ...[详细]
Truy tìm tài xế ô tô tải đâm tử vong người đi bộ trên cao tốc rồi bỏ chạy
iPhone SE 4 sản xuất hàng loạt trong tháng 12, ra mắt sớm hơn dự kiến
- Từ 28/6 Google Drive sẽ tự động sao lưu ổ cứng
- iPhone SE 4 sẽ chia tay Qualcomm bằng chip 5G 'nhà làm'
- Dân mạng sáng tạo không tưởng để khắc chế điểm yếu số 1 của Mac Mini
- Xu hướng tìm kiếm về kỳ nghỉ lễ cuối năm tăng vọt 127%
- Ủy ban Thường vụ Quốc hội sẽ cho ý kiến chuẩn bị Kỳ họp bất thường lần thứ 9
- Hội nghị Quốc tế Techsauce 2024: Hướng đến thúc đẩy nền kinh tế số bền vững
- Hướng dẫn tắt AirDrop trên iPhone và iPad