Florian Brand ( Prime Intellect的工程师、Interconnects AI的编辑)五一期间刚到中国AI实验室来访问,转了一圈后写下了他的感受。看他的文章对国内AI研究员们描写的非常鲜活。去过的实验室包括:Moonshot、小米、MiniMax、智谱、美团、阿里巴巴、蚂蚁灵境、ModelScope、零一万物、宇树科技。| 原文
下面是翻译。
-- 我在中国 AI 实验室感受到的氛围
在过去大约 10 天里,我有机会和 SAIL 的一群很棒的人一起访问中国的 AI 实验室。作为一个在半年内第一次分别去中国和美国的人,我发现两地的差异很有意思,但更让我着迷的是它们之间的相似之处。
我最强烈的印象是,我见到的 AI 研究人员都非常谦逊。他们对其他实验室和同行评价很高。DeepSeek 经常被提起,可能是因为他们在我们访问前几天刚发布了一个模型;大家谈起 DeepSeek 的论文时都带着真诚的钦佩。很多研究人员彼此都是好朋友,要么上过同一所大学,要么来自同一个家乡。他们会很开放地讨论自己的工作,而这些发现往往会在几个月后写进论文里。
这是它和西方 AI 圈最大的不同之一。在美国,整体氛围常常更像是一种零和竞争。各个实验室都很谨慎地塑造自己的定位。研究人员会考虑竞争,有些人也很自视甚高。领导者们会在泄露的备忘录里互相辱骂和攻击。这种差异或许可以用一个事实来解释:美国领先的实验室大多是闭源的,而许多中国实验室是开放的。中国实验室对字节跳动的豆包感到“害怕”——豆包是使用量遥遥领先、同时又闭源的聊天机器人。
与此同时,整体的能量感又和旧金山出奇地相似。这些研究人员都是重度网民,大量阅读 Twitter 和小红书,其中小红书正变得越来越受欢迎。他们都在用 Claude Code,或者自己的 CLI,来构建下一个模型。有些人在我们开会期间还在监控训练任务,看 reward curve 往上走。他们在思考如何进一步扩展规模,也抱怨算力不够。他们对当前基准测试的状态感到不满。
他们的主要关注点是训练出更好的模型。这一点不同于旧金山,在那里研究人员会思考 AI 的政治或哲学影响。他们不怎么讨论大规模失业、永久性的底层阶级,或者自己的模型是否有意识。他们只是想训练出优秀的模型。当他们听说你用过他们的模型时,眼睛会亮起来。他们迫切希望在下一代模型中修复当前模型的所有缺点。他们会通宵熬夜推动模型发布,然后第二天仍然出现在办公室。
我见到的大多数研究人员都非常年轻,很多人二十出头或二十五六岁。有些还是本科生,但更常见的是在读博士,同时在工业界工作并继续做研究。他们之间的共识是:相比学术界,现在工业界显然更有意思。我非常认同这一点,因为我自己也做过完全一样的选择。这些实验室非常重视这类人才获取,积极招聘实习生和研究生;这是西方实验室不太做的事情。
研究人员的乐观情绪也延伸到了普通人群中。普通大众似乎对技术以及 AI 和机器人技术的前景更加乐观。旅途中有人讲起他们的父母、祖父母用豆包和 DeepSeek 做各种事情,包括絮絮叨叨地讨论数学定理。这当然和西方很不一样,在西方,普通大众对 AI 往往很反感。
总的来说,这次旅行让我对这个生态系统有了一个很小的窥见。想在短短几天内了解这样一个庞大文明的文化,是不可能的。作为开放 AI 生态和开放研究的坚定支持者,我对二者的未来感到非常乐观,也希望这能在未来带来大量国际合作。
我想感谢我在 Moonshot、小米、MiniMax、智谱、美团、阿里巴巴、蚂蚁灵境、ModelScope、零一万物、宇树科技以及其他地方见到的所有很棒的人。感谢你们抽出时间,也感谢你们热情的接待。同时,也感谢 SAIL 组织这次行程,感谢所有同行的作者和记者。能在如此短的时间里遇到这么多聪明而有抱负的人,我非常感激。
下面是翻译。
-- 我在中国 AI 实验室感受到的氛围
在过去大约 10 天里,我有机会和 SAIL 的一群很棒的人一起访问中国的 AI 实验室。作为一个在半年内第一次分别去中国和美国的人,我发现两地的差异很有意思,但更让我着迷的是它们之间的相似之处。
我最强烈的印象是,我见到的 AI 研究人员都非常谦逊。他们对其他实验室和同行评价很高。DeepSeek 经常被提起,可能是因为他们在我们访问前几天刚发布了一个模型;大家谈起 DeepSeek 的论文时都带着真诚的钦佩。很多研究人员彼此都是好朋友,要么上过同一所大学,要么来自同一个家乡。他们会很开放地讨论自己的工作,而这些发现往往会在几个月后写进论文里。
这是它和西方 AI 圈最大的不同之一。在美国,整体氛围常常更像是一种零和竞争。各个实验室都很谨慎地塑造自己的定位。研究人员会考虑竞争,有些人也很自视甚高。领导者们会在泄露的备忘录里互相辱骂和攻击。这种差异或许可以用一个事实来解释:美国领先的实验室大多是闭源的,而许多中国实验室是开放的。中国实验室对字节跳动的豆包感到“害怕”——豆包是使用量遥遥领先、同时又闭源的聊天机器人。
与此同时,整体的能量感又和旧金山出奇地相似。这些研究人员都是重度网民,大量阅读 Twitter 和小红书,其中小红书正变得越来越受欢迎。他们都在用 Claude Code,或者自己的 CLI,来构建下一个模型。有些人在我们开会期间还在监控训练任务,看 reward curve 往上走。他们在思考如何进一步扩展规模,也抱怨算力不够。他们对当前基准测试的状态感到不满。
他们的主要关注点是训练出更好的模型。这一点不同于旧金山,在那里研究人员会思考 AI 的政治或哲学影响。他们不怎么讨论大规模失业、永久性的底层阶级,或者自己的模型是否有意识。他们只是想训练出优秀的模型。当他们听说你用过他们的模型时,眼睛会亮起来。他们迫切希望在下一代模型中修复当前模型的所有缺点。他们会通宵熬夜推动模型发布,然后第二天仍然出现在办公室。
我见到的大多数研究人员都非常年轻,很多人二十出头或二十五六岁。有些还是本科生,但更常见的是在读博士,同时在工业界工作并继续做研究。他们之间的共识是:相比学术界,现在工业界显然更有意思。我非常认同这一点,因为我自己也做过完全一样的选择。这些实验室非常重视这类人才获取,积极招聘实习生和研究生;这是西方实验室不太做的事情。
研究人员的乐观情绪也延伸到了普通人群中。普通大众似乎对技术以及 AI 和机器人技术的前景更加乐观。旅途中有人讲起他们的父母、祖父母用豆包和 DeepSeek 做各种事情,包括絮絮叨叨地讨论数学定理。这当然和西方很不一样,在西方,普通大众对 AI 往往很反感。
总的来说,这次旅行让我对这个生态系统有了一个很小的窥见。想在短短几天内了解这样一个庞大文明的文化,是不可能的。作为开放 AI 生态和开放研究的坚定支持者,我对二者的未来感到非常乐观,也希望这能在未来带来大量国际合作。
我想感谢我在 Moonshot、小米、MiniMax、智谱、美团、阿里巴巴、蚂蚁灵境、ModelScope、零一万物、宇树科技以及其他地方见到的所有很棒的人。感谢你们抽出时间,也感谢你们热情的接待。同时,也感谢 SAIL 组织这次行程,感谢所有同行的作者和记者。能在如此短的时间里遇到这么多聪明而有抱负的人,我非常感激。