「 导读 」 「长文本之王」 Kimi AI,三次登上热搜,真的好用吗?
01 / 三把火 .
今天来聊聊最近在AI圈火得一塌糊涂的Kimi。
Kimi一共火了3次:
第一次,是因为长文本。
去年10月底,Kimi一鸣惊人,推出了支持输入20万汉字的能力,成为全球首个开放「超长上下文窗口」的大模型。
这在当时可是国人骄傲,媒体纷纷报道,连我带的AI孵化器的大学生们都觉得,这长文本窗口,辅助论文简直不要太方便。
尽管谷歌在今年3月推出了Gemini 1.5 Pro,直接把上下文突破到了100万,Kimi也不甘示弱,紧随其后开放了200万版本,誓要坐稳「长文本」宝座。
第二次,是因为创始人。
Kimi所属的「月之暗面」公司,创始人杨植麟,是卡内基梅隆大学的计算机博士,参与过谷歌Gemini、Bard、盘古、悟道等多个大模型的研发。
今年3月,腾讯科技的专访让杨植麟和朱啸虎隔空battle,杨植麟坚定看好大模型前景,而作为投资人的朱啸虎,则更支持能快速商业化的AI应用项目。
这一战,让杨植麟作为技术信仰派,又狠狠吸了一波粉!
第三次,是因为投流量。
3月底开始,抖音、B站、公众号,各大平台都能看到Kimi的广告,而且广告十分接地气,被大家调侃跟「短剧」投流一个画风,不像科技企业。
这次持续投流,可真是让Kimi火出圈了,3月访问量直接翻了3倍。
02 / 功能不全 .
然而,Kimi真的这么好吗?我的答案是:一般。
我曾经分析过大模型APP的4个标配产品能力: 联网查询、多模态、语音交互、智能体生态。
每个能力对于用户体验、大模型数据积累等都很重要。
以上这些能力,Kimi在打出「20万字」口号时,都没有。
国内的大模型应用:智谱清言、文心一言、通义千问、讯飞星火、豆包、天工、MiniMax等,我一直紧密关注。Kimi的迭代节奏,一 直是滞后的。
在其他平台支持联网查询时,Kimi只能上传文档,直到最近才加入了联网查询的能力。
在多模态方面,Kimi虽然现在支持了图片格式的文件分析,但还未能实现图像生成。
至于语音交互,Kimi至今未能提供,只能输出书面化的长篇大论,无法通过更符合人类日常沟通习惯的方式,获取口语化的简洁信息。
在智能体生态方面,最近才推出了Kimi+,但仅限于官方智能体,而其他平台早就支持用户自定义复杂的智能体。
03 / 负面信息 .
Kimi是第二批通过算法备案的大模型,相较于智谱、百度、MiniMax等首批大模型,起步晚了3个月。
可是同为第二批的天工AI,现在可是能力齐备,甚至创新了天工AI搜索引擎、Sky Music音乐大模型。
而Kimi的优势,仿佛只有一个「长文本」。
但在Kimi开放了200万字版本后,阿里、360等大厂迅速开放了1000万、500万的长文本能力,打脸Kimi AI。
其中的信号再明显不过:长文本处理并非难以攻克的技术难题,只是一次处理几百万文本太烧算力,因此各家才不推崇。
这样看来,Kimi烧算力、投广告、甚至爆出创始人卖老股的传言,和「技术信仰派」相悖甚远。
04 / 结语 .
AI企业的真实价值,不在于怎样说,而在于怎样做。
在无关紧要的竞争上浪费资源,卷来卷去,无异于劣币驱逐良币,杀敌一千自损八百。诚恳一点,才能增强市场和公众对国内AI发展的信心!
火焰虽美,但烟雾缭绕。我们需要的,是在拨云见日后,拥有真正的AI技术,能够改变生产生活的AI技术。
今天的分享就到这里,欢迎关注、留言,交流你的看法。我们下期再见!
「 See you 」 我是一名AI从业者 | 大学生AI产品导师 。如果你偏爱以轻松的方式了解AI领域的最新动态,欢迎 关注我 !
欢迎一键三连