最近一段时间ღ★,一家名为“DeepSeek”的中国AI公司ღ★,频繁被硅谷的技术大佬提起ღ★,讨论之热烈ღ★,甚至引来了美国最大的财经频道CNBC的关注勇士的信仰无敌版ღ★。
CNBC的女主持人在试用过DeepSeek推出的语言大模型后ღ★,称赞这款产品的回答“几乎与ChatGPT-4一样完美”ღ★。
其实ღ★,某家中国公司能复制出与美国差不多的产品ღ★,并不稀奇ღ★,硅谷的创新企业早已习惯了中国人的“跟随战略”ღ★。
第一ღ★,开发成本极低ღ★。这家中国公司仅用了550万美元就训练出了美国公司要用5亿美元训练的模型ღ★。
油管上一位AI博主ღ★,统计了硅谷企业训练大模型的成本后勇士的信仰无敌版ღ★,得出结论ღ★:DeepSeek仅用了2.8%的资金ღ★,就开发出媲美甚至超越ChatGPT-4的模型ღ★。
他表示自己免费使用了DeepSeek几天后ღ★,已经找不到继续每个月花20美元订阅ChatGPT的理由ღ★,完美平替ღ★。
第二ღ★,完全开源ღ★。CNBC的女主持人略带嘲讽地表示ღ★:虽然OpenAI名字里有“Open(开放)”一词ღ★,但美国主流的AI公司全是闭源的ღ★,一点不“Open”ღ★。
反倒是中国的DeepSeek完全开源——任何AI爱好者在全球任意的地点ღ★,都可以调用DeepSeek的底层代码ღ★。
正如苹果与安卓系统的竞争ღ★,闭源的苹果或许能带来更高的安全性ღ★,但开源的安卓应用更广泛ღ★,占领了全球80%的手机市场ღ★。DeepSeek似乎想用开源的方式ღ★,复制安卓的成功ღ★。
第三ღ★,最令美国人尴尬的是ღ★,DeepSeek在训练时使用的GPU是“阉割版”的英伟达H800ღ★,其性能不如美国公司使用的H100ღ★。
要知道ღ★,美国原本寄希望于禁止中国公司购买先进GPU的方式ღ★,来限制中国AI的发展ღ★。DeepSeek的横空出世ღ★,无疑让美国的制裁ღ★,看上去有点可笑了ღ★。
看到这里ღ★,很多粉丝一定好奇ღ★,DeepSeek究竟是一家什么样的公司ღ★,为何之前都没听说过???
这还真不能怪我们勇士的信仰无敌版ღ★,因为DeepSeek成立时间太短了ღ★,距离现在仅15个月而已ღ★,成立于2023年的9月ღ★。
再者ღ★,与阿里ღ★、腾讯ღ★、百度这样动辄几万人的大厂相比ღ★,DeepSeek小的“可怜”ღ★,初创时只有50人ღ★,现在也就200来人ღ★,是一家既新又小的公司ღ★,所以之前没听过很正常ღ★。
小归小ღ★,但DeepSeek的创始人梁文锋在投资圈非常有名ღ★,这位出生于广东小县城的大佬ღ★,早年经历不详ღ★,只知道父亲是一名小学教师ღ★,家庭教育不错ღ★。
2008年左右ღ★,从浙江大学毕业后ღ★,虽然学的是人工智能专业ღ★,但梁文锋几经考虑后ღ★,还是决定“先富起来”ღ★,做起了金融勇士的信仰无敌版ღ★,主攻对冲基金ღ★。
普通人遇到这种情况ღ★,嘴早笑歪了ღ★,可梁文锋看到的却是风险ღ★,近两年他着手降低基金的规模ღ★,控制在了两三百亿的范围J9九游会中国ღ★。
2023年ღ★,梁文锋在北大附近的一座办公楼中成立了DeepSeekღ★。起初团队只有50人勇士的信仰无敌版ღ★,而且清一色的是没有留学背景的“土鳖”ღ★,纯中国本土大学教育培养出的团队J9九游会中国ღ★。
这或许与梁文锋自己没有留学的经历有关ღ★,他曾说ღ★:中国的大厂ღ★,喜欢去美国挖AI人才ღ★,需要耗费大量的精力与成本不说ღ★,效果还不一定有本土团队好ღ★。
这个架构的神奇之处在于大大降低了GPU显存的使用率ღ★,等于变相提高了算力ღ★,降低了训练成本ღ★。OpenAI的联合创始人看了MLA架构的论文后惊呼ღ★:这是今年AI行业最好的架构ღ★!
该架构的灵感来自一场讨论会勇士的信仰无敌版ღ★,在研究完市面主流架构后J9九游会中国ღ★,一位年轻的员工提出了一个全新的角度理解架构问题ღ★,大家听后都觉得有道理勇士的信仰无敌版ღ★,便在CTO的组织下J9九游会中国ღ★,进行可行性研究ღ★,没想到挖到个宝ღ★,真跑通了ღ★。
而“洋和尚”往往是硅谷次一级的人才ღ★,让他们搭建个主流架构ღ★,一点问题没有ღ★,干得又快又好ღ★,但说到创新ღ★,不好意思ღ★,硅谷公司聘他们的时候ღ★,就是来干苦活ღ★、累活的ღ★,创新是公司核心层的事儿ღ★。那些核心人才ღ★,国内的大厂别说挖ღ★,接触都接触不到的ღ★。
梁文锋还纠正了一个国内AI界流行的说法——中国的AI技术只比美国落后一到两年ღ★,好像加把劲就能追上ღ★。
但现实是ღ★,中国AI与美国的根本差距在创新上ღ★,每次都是美国人先搞出个什么东西J9九游会中国ღ★,中国立刻跟进ღ★,仿个差不多的ღ★。这么搞永远有一到两年的差距ღ★,不可能追上ღ★。
梁文锋惋惜地表示ღ★,似乎大部分中国科技公司也习惯了这种模式ღ★,感觉追赶是理所当然的事情ღ★,领先反倒不正常了ღ★。
而DeepSeek在这波AI浪潮中ღ★,初心就不是捞一笔就跑ღ★,而是要走到技术的最前沿ღ★,去推动整个生态的发展ღ★。
考虑到DeepSeek是一家刚成立15个月的公司ღ★,我觉得梁文锋并非在“画饼”ღ★,是有可能实现的ღ★,毕竟他们已迈出了突破性的一步ღ★。
如果把DeepSeek放在更大宏达的产业转型中去分析ღ★,会发现过去中国人赚钱ღ★,大都靠运气和关系J9九游会中国ღ★,导致中低端红利被吃干净了ღ★,未来再想发大财ღ★,更依赖技术与创新ღ★,创业的门槛正变得越来越高ღ★,想要不被时代淘汰ღ★,我们要时刻处于学习与进步之中ღ★,否则下一个被AI淘汰的就是我们自己ღ★。真人游戏第一品牌九游会j9官方网站ღ★,j9九游会 - 真人游戏第一品牌ღ★,j9九游会ღ★,j9九游会官方网站AI应用ღ★,九游会官网J9ღ★。九游ღ★,