公司新闻
首个AI Kaggle特级大师诞生OpenAI的o1-preview夺7金封王
更新时间 2024-10-13 16:20
阅读
kaiyun中国网站该基准包括 75 个 Kaggle 竞赛,旨在衡量自主 AI 系统在机器学习工程中的进展。这些竞赛涵盖了多个领域,包括自然语言处理、计算机视觉和信号处理等等。
IT之家注:Kaggle 是一个非常受欢迎的平台,专注于数据科学和机器学习的在线比赛。Kaggle 提供各种类型的比赛,包括数据预测、图像分类、自然语言处理等,适合不同技能水平的参与者。
在 Kaggle 的进阶系统中,“Novice”(新手)、“Contributor”(贡献者)、“Expert”(专家)、“Master”(大师)和 Grandmaster(特级大师)是不同的绩效层级,用于衡量和识别数据科学家在 Kaggle 平台上的技能水平和成就。
许多任务具有现实世界的应用,例如预测 COID-19 mRNA 疫苗降解或解码古代卷轴等。
OpenAI 承认 MLE-bench 也有局限性,并未涵盖 AI 研究与开发的所有方面,主要集中在具有明确问题和简单评估指标的任务上。
MLE-bench 基准现已在 GitHub 上发布,OpenAI 希望通过这一工具,推动 AI 在机器学习领域的进一步发展。