OpenAI联合创始人Andrej Karpathy加盟Anthropic,投身大模型前沿

Andrej Karpathy,这位39岁的斯洛伐克裔加拿大AI研究员,同时也是OpenAI的11位联合创始人之一,以及特斯拉前AI部门负责人,已于5月19日宣布加入其竞争对手Anthropic。

正如Karpathy在其X社交平台账户上所发布的那样:“个人更新:我已加入Anthropic。我认为未来几年,大语言模型(LLM)的前沿领域将极具开创性。我非常兴奋能加入这个团队,并重新投入到研发工作中。我依然对教育抱有极大的热情,并计划在不久的将来重启相关项目。”

Anthropic现任预训练负责人Nicholas Joseph,同样也是一位前OpenAI成员,在他的X帖子中为Karpathy的新角色补充了更多细节:“非常欢迎Andrej加入预训练团队!他将组建一个团队,专注于利用Claude(Anthropic的标志性AI模型)来加速预训练研究本身。我想不出有谁比他更适合这项工作了——期待我们共同创造的未来!”

Anthropic的一位发言人通过邮件向VentureBeat确认,Karpathy将启动一个团队,该团队将利用Anthropic日益流行的AI模型Claude来加速预训练研究。此举将使Anthropic更接近许多全球AI研究人员所追求的终极目标——“递归自我提升”,即AI能够训练其继任者或在没有人类干预的情况下自我升级。

这一消息恰逢谷歌年度I/O开发者大会在加州山景城总部开幕,当时外界正期待着众多新产品的发布与公告。

Karpathy的传奇经历

Karpathy在现代AI热潮中,以其在学术研究、大型企业应用和在线教育三大领域的涉足而广为人知。

他个人网站上的简介显示,他是一位AI研究员和教育家,曾是OpenAI的创始成员,后来担任特斯拉的AI总监,并帮助创建了斯坦福大学的首门深度学习课程CS231n。

OpenAI在2015年12月的启动公告中,也将其列为创始成员之一。

在特斯拉工作期间(2017-2022年),他领导了Autopilot的计算机视觉团队,并称其团队负责内部数据标注、神经网络训练以及在特斯拉定制推理芯片上的部署。

此后,他在2023年至2024年间重返OpenAI,期间组建了一个专注于中期训练和合成数据生成的团队——这段经历与他在Anthropic的预训练岗位直接相关。

Karpathy的学术生涯始于斯坦福大学,他在李飞飞教授的指导下获得博士学位,研究方向为用于计算机视觉、自然语言处理以及两者交叉领域的神经网络。

据其网站介绍,他还曾在谷歌大脑、谷歌研究院和DeepMind实习。他的教育背景包括英属哥伦比亚大学的硕士学位和多伦多大学的学士学位,主修计算机科学和物理双专业。

开源研究与教育承诺将何去何从?

自2024年离开OpenAI以来,Karpathy已成为AI领域最具影响力的公共教育家之一,通过发布关于大语言模型和神经网络的技术及科普视频与公众交流。

他还于2024年7月创立了Eureka Labs,定位为“AI原生”学校;其首款产品LLM101n,被描述为一门本科级别的课程,引导学生训练自己的AI系统。

在过去两年作为独立研究者的时间里,Karpathy还通过产品和技术标准推动了开源AI研究的进步,包括autoresearch(一个由LLM驱动的自动研究者,可同时运行多个假设和实验)以及LLM Knowledge Base(一个为AI代理设计的自主记忆和上下文存储系统,形如一个可供其访问的持续增长的图书馆)。

一个关键问题随之而来:随着他加入Anthropic——一个主要通过发布专有AI模型(如Claude)而闻名,尽管也推出了Model Context Protocol(MCP)技术标准来支持开源——他这些以及更广泛的AI开源努力将何去何从?

根据他在X上公告帖子的最后一句——“我依然对教育抱有极大的热情,并计划在不久的将来重启相关项目”——至少他对于AI原生学校的贡献在加入Anthropic初期可能会暂停。


关注微信号:智享开源 ,更多信息访问网站:blog.imcn.me

原文链接:https://venturebeat.com/technology/andrej-karpathy-announces-hes-joining-anthropic

评论列表
 
 
发表评论
😀 😂 😃 😄 😅 😆 😉 😊 😋 😎 😍 😘 🥰 😜 😝 🤗 🤔 😭 😤 👍

为你推荐
Ta的个人站点

Mark Do发布文章835篇


关注微信

主站最新信息

[blog_mailer_subscribe]

分类