站内搜索 | 手机版

智快网 - 新科技与新能源行业网络媒体

当前位置：智快网 > 热点 > 正文内容

OpenAI再夺7金，o1-preview成首个AI Kaggle特级大师！

发布时间：2024-10-12 21:12 来源：ITBEAR 作者：柳晴雪

科技媒体The Decoder于昨日发布了一篇引人注目的报道，披露了OpenAI公司最新推出的MLE-bench基准。这一基准旨在评估AI智能体在开发机器学习解决方案方面的实力，覆盖了75个Kaggle竞赛，涵盖了自然语言处理、计算机视觉和信号处理等多个领域。

MLE-bench专注于两个核心领域：选择具有挑战性的任务，这些任务代表着当前机器学习的发展前沿；比较AI与人类的表现，以此评估AI在特定任务中的能力。

OpenAI在MLE-bench上测试了多个AI模型和智能体框架，其中使用AIDE框架的o1-preview模型表现尤为出色，在16.9%的比赛中至少获得了一枚铜牌，这一成绩甚至超越了Anthropic的Claude 3.5 Sonnet。

值得注意的是，MLE-bench上的任务具有现实世界的应用价值，如预测COVID-19 mRNA疫苗的降解或解码古代卷轴等。而获得5枚金牌即可评为“Grandmaster”特级大师，o1-preview模型在测试中更是获得了7枚金牌。

然而，OpenAI也承认MLE-bench存在局限性，它并未涵盖AI研究与开发的所有方面，而是主要集中在那些具有明确问题和简单评估指标的任务上。

尽管如此，MLE-bench基准的推出无疑为AI在机器学习领域的发展提供了新的推动力。该基准现已在GitHub上发布，OpenAI希望通过这一工具，进一步推动AI在机器学习领域的创新与应用。

更多>同类内容

微星I系列水冷升级扣具，散热效率提升3%！

10-12

腾讯微信鸿蒙原生版上线，华为商店新选择！

10-12

优派新品来袭！27英寸4K显示器，仅1379元，香不香？

10-12

OpenAI新推Swarm框架，多AI智能体交互将更简单？

10-12

HKC新品登场！27英寸2K 240Hz QD-OLED显示器，仅3499元

10-12

酷比魔方掌玩mini2新动作！新增“教育/老人版”仅948元

10-12

1200名民间足球高手集结芜湖，智能外援宇视助力吴钩总决赛

10-08

贾跃亭“神之一手”！桥梁战略令FF股价一夜大涨124%，两日涨268%！

08-23

TCL实业鸿鹄实验室：构筑开放创新技术平台，加速未来智慧生活

08-21

TCL实业荣获EISA2024-2025年度三项大奖

08-21

超值搅局者又来了这次轮到七座插混们瑟瑟发抖

08-19

INTO：Web3世界的“流量磁石”

08-09

极空间私有云新功能【监控中心】：支持Onvif摄像头，实现视频本地存储

07-31

国际橡塑展满载商机回归大湾区，年度盛事不容错过的10大理由

07-30

阿里云修复100年前巴黎奥运珍贵影像，国际奥委会主席巴赫致谢！

07-30

点击查看更多 +

全站最新

OpenAI再夺7金，o1-preview成首个AI Kaggle特级大师！

OpenAI再夺7金，o1-preview成首个AI Kaggle特级大师！

中国移动发布新成果：九天善智多模态基座及30+自研行业大模型！

中国移动发布新成果：九天善智多模态基座及30+自研行业大模型！

iQOO 13真机图曝光：镜头模组新设计，RGB灯带吸睛？

iQOO 13真机图曝光：镜头模组新设计，RGB灯带吸睛？

Akasa新推USB4移动硬盘盒，内置风扇主动散热，速度有多快？

Akasa新推USB4移动硬盘盒，内置风扇主动散热，速度有多快？

《极乐迪斯科》团队新作，《XXX NIGHTSHIFT》官宣，角色扮演新体验！

《极乐迪斯科》团队新作，《XXX NIGHTSHIFT》官宣，角色扮演新体验！

乔思伯D32 M-ATX STD小机箱，10月17日开售，你准备好了吗？

乔思伯D32 M-ATX STD小机箱，10月17日开售，你准备好了吗？

微星I系列水冷升级扣具，散热效率提升3%！

微星I系列水冷升级扣具，散热效率提升3%！

摩托罗拉新专利曝光，小折叠手机自拍神器？电动铰链亮了！

摩托罗拉新专利曝光，小折叠手机自拍神器？电动铰链亮了！

热门内容

本栏最新

OpenAI再夺7金，o1-preview成首个AI Kaggle特级大师！

OpenAI再夺7金，o1-preview成首个AI Kaggle特级大师！

微星I系列水冷升级扣具，散热效率提升3%！

微星I系列水冷升级扣具，散热效率提升3%！

腾讯微信鸿蒙原生版上线，华为商店新选择！

腾讯微信鸿蒙原生版上线，华为商店新选择！

优派新品来袭！27英寸4K显示器，仅1379元，香不香？

优派新品来袭！27英寸4K显示器，仅1379元，香不香？

OpenAI新推Swarm框架，多AI智能体交互将更简单？

OpenAI新推Swarm框架，多AI智能体交互将更简单？

HKC新品登场！27英寸2K 240Hz QD-OLED显示器，仅3499元

HKC新品登场！27英寸2K 240Hz QD-OLED显示器，仅3499元

酷比魔方掌玩mini2新动作！新增“教育/老人版”仅948元

酷比魔方掌玩mini2新动作！新增“教育/老人版”仅948元

1200名民间足球高手集结芜湖，智能外援宇视助力吴钩总决赛

1200名民间足球高手集结芜湖，智能外援宇视助力吴钩总决赛

智快实验室评测约稿合作邮箱：z@zhikuai.com 腾讯QQ:642361(注明:智快网) 简体繁体根据客户端智慧切换，如显示有问题，请点击页面右上角的简繁切换功能！
Copyright © 2016-2021 zhikuai.com All rights reserved. 鲁ICP备20033456号

ITBear微信账号

微信扫一扫
加微信拉群
电动汽车群
科技数码群