Kimi发布了K2 Thinking版本后,迅速火爆。
顺便点燃了一个概念:模型即Agent。
在国外的测评中,很多领域一跃成为超越ChatGPT5的大模型(也有评测认为K2 Thinking略逊于ChatGPT5)。
Kimi K2 Thinking 在 TAU 榜单(智能体工具调用能力测试)上排名第一,超过 OpenAI 和 Anthropic 的旗舰模型。
这是开源模型首次超越世界顶级的商业闭源模型。
是的,Kimi是开源的。
如今,K2 Thinking版本成为开源平台huggingface排名第一的大模型。
就在前一天,MiniMax M2当了一周的第一名。
在千模大战的时代,能在huggingface上站稳一周的非常罕见。
MiniMax M2来自一家中国的初创企业,叫上海稀宇科技。
Kimi则来自月之暗面。
非常浪漫和中二的名字,创始人杨植麟是一名九零后,毕业于清华计算机系(本科)和卡内基梅隆大学计算机学院(博士)。
他的导师,是清华大学人工智能研究院基础模型研究中心主任唐杰教授,是一名七五后。
唐杰教授亲手孵化出了智谱清言,智谱现在也是世界前五的顶级存在。
在中国的AI领域,产学研融合一条龙的局面已经形成。很多优秀的AI人才,在读书阶段就已经进入最顶级的AI公司发挥自己的能量。
有一个背景新闻:K2 Thinking发布的当天,华为昇腾就完成了适配。
这也意味着,两个团队在开发过程中就保持着联系。
其实玩大模型的业内人士都知道,在中国,几乎所有的大模型之间,软硬件团队都是互相保持沟通的。
一方面有适配国产硬件和软件栈的强制要求,另一方面中国的AI团队(主动也好、被动也好)乐于互相交流促进共同进步。
星空君有个观点:AI领域太适合集中力量办大事这种体制了。
从ChatGPT爆火开始,星空君就认为这是力大砖飞的结果,也曾经做过详细论述。
之所以微软谷歌没有首先成功,是上市公司不太可能在一个不明朗的方向狂烧100亿美刀的显卡,董事会股东会都过不了审。等到OpenAI把路径探明了再烧也不迟,现在谷歌的Gemini已经进入顶级大模型序列。
随着路线图的清晰,中国体制几乎是AI大模型的温床。
举一个例子,各大央企开始开发各自领域的行业大模型(是它们自愿的吗?),且必须使用国产算力(昇腾、摩尔等),核心领域必须全栈自研。
讯飞支撑中国移动和中国石油的行业大模型,智谱支撑中国石化的行业大模型... ...
造国产卡的有了保底销量,搞自研的团队有了兜底大客户。
是不是很像5G?
先做基建,再找场景。
星空君对5G的定位是“不失败”,它虽然没有达到预期的高目标,但超过了预期的低目标。尤其是实现了基站设备和技术标准的国产化,不用给诺基亚爱立信们支付巨额专利费,还带动了一大批产业链企业。
遗憾的是,5G的场景并没有特别的丰富(虽然现在B端的5G专网爆火,但C端应用场景没有革命性的突破)
AI的好处是,你不愁场景,无论B端还是C端 ,应有尽有。
星空君最近做了几次讲座,去给员工讲智能体,结合日常工作的案例,从做合同到写分析到出通报,都可以实现AI智能化,然后大家发现用智能体可以大幅提高工作效率。
企业愿意推,员工愿意用,还能降低软件开发成本。