当一名硅谷创业者决定参加百度“文心杯”大赛
2023-09-06 13:25 AI

“我在美国参加过很多次黑客马拉松了,所有和人工智能相关的比赛,我都会报名。但这次,是我们团队第一次尝试用国内的大语言模型。我感觉到了很多惊喜,比如在速度上,文心一言比ChatGPT的生成答案速度还快。”Buysmart.AI创始人陈历飞说,这位1993年出生的创业者专门从硅谷飞来北京,参加百度“文心杯”创业大赛。

随着大语言模型的热潮席卷全球,人工智能不再是实验室和大型科技公司的专属,而是成为初创公司的焦点,基于大语言模型底座,各种创新项目喷涌而出。作为人工智能行业的领跑者,百度希望与众多开发者一起,构建一个繁荣强大、充满活力的人工智能生态。

5月31日,百度创始人、董事长兼CEO李彦宏宣布启动“文心杯”创业大赛,为决赛入营团队提供可稳定调用的文心大模型API及百度智能云算力资源,获得最高奖项的选手将获得价值一千万元的早期投资。

百度打响了中国大模型的第一枪,不到一个月的时间,这场备受瞩目的盛事吸引了近 1000 个项目报名,参与者包括来自海内外大厂的明星产品经理,受投资人追捧的连续创业者,斯坦福大学、牛津大学、康奈尔大学、清华大学等名校出身的团队,还有来自传统行业的资深大咖。这为后互联网时代的创业环境,注入了一股新的活力。

01

把GPT换成文心一言

“之前在海外我们用的GPT,这次换成了文心一言,难度没有预想的那么大。”陈历飞很开心,改动不需要太多,流程就能顺利跑起来。除了文心一言的速度给他带来了惊喜,他还发现同样的英文prompt,文心一言能直接给出优秀的中文回答。切换成中文prompt后,文心一言的回答还能更好。

不仅如此,在中文环境下,文心一言的回答还更符合本土特色。陈历飞在测试的时候发现,如果提问如何选购一款产品,文心一言在回答完后,往往再加上一句:“有什么详细问题可以跟客服沟通”。但GPT的回答里一般不会出现这句话的,因为海外电商平台几乎没有客服在线上随时解惑,大家都用邮件联络,如果碰上非工作时间,那更是需要漫长的等待。

陈历飞是在一个在硅谷的人工智能创业者社群里看到“文心杯”启动的消息的,接下来一切都很顺利,从报名、初赛到冲进决赛,他的项目评分都很高,最终获得大赛一等奖。陈历飞总结首先是自己的方向选对了,他认为:“通过大语言模型革新线上购物体验一定是未来趋势,AI电商会是兵家必争之地。”

陈历飞的创业项目Buysmart.AI,目前主要针对海外市场,基于大模型和自研推荐技术为用户提供购物意图理解、全网商品集合、决策、导购一站式方案,也就是做一个智能买手AI Agent,协助用户更轻松更好地完成购物决策。简单来说,这个智能买手只做两件事:理解用户的需求、找到满意的商品。

举个例子,用户想买一款适合自己的护肤品,简单粗暴的一个推荐系统是解决不了问题的。大语言模型需要问出用户的肤质、诉求、偏好、预算等问题,接下来,把用户的基本诉求跟商品的功能参数做一个映射,然后再做商品的评估推荐。大语言模型和推荐系统相互配合,将整个流程逐渐完善。

“比如我给你一万块钱,让你帮我买一个最适合我的摩托车。那你第一步肯定是去学习,学很多关于摩托车的知识,看大家的评价,再找一些销售咨询。学完后,你还要跟我交流这个摩托车的使用场景,核心诉求等等。慢慢的,你就知道如何从市场上选购合适的摩托车了。而现在,我们把这个流程交给AI,它理解完你的需求后,代表你,去把市面上十万个摩托车型号都看一遍,然后回来告诉你哪一款最适合你。”陈历飞解释说。AI可以学习线上的各种种草攻略、商品介绍和用户评论,最终成为该领域的专家。

押注智能电商赛道和他个人的工作经历有关。在取得了卡内基梅隆大学的计算机硕士学位后,陈历飞在Facebook(Meta)工作了四年半,主要做广告推荐。“比如我给用户推了100个帖子,用户点了这些,没点哪些,这是为什么?用户点的帖子里都出现了车,那我再给他推个车?那他反而不点了。到底是什么原因,我们一直在通过算法和大数据在后台猜。”陈历飞说,“但现在,我们别猜了,想知道什么让AI直接问用户就好了。”

从Facebook出来后,陈历飞回国加入小红书,做自然语言处理方向。他发现很多用户已经把小红书当做搜索引擎来用了。去哪里吃饭,去哪里玩,去哪里打卡……大家都喜欢问小红书,都想在小红书上寻求一个决策。但小红书信息繁杂,也有“恰饭”帖子混在其中,还是得靠用户自己辨别。于是陈历飞下了一个赌注,那就是未来人类信任的转移。他认为,从过去到现在,人类的信任对象已经从身边的人,比如亲戚朋友,转移到了线上的人,比如明星、KOL。而未来,信任一定会转移到AI上。因为你的AI比别人更了解你,有更多的知识,能完全站在你的角度思考问题,全心全意维护你的利益。

那么当下的信任问题如何解决?Buysmart.AI的策略是尽量让自己站在用户角度思考问题。比如用户问,我是一个新手,突然想学打高尔夫球,能不能给我推荐一款高尔夫球杆?这时候如果AI的回答是:“初学者的话,我建议你去二手市场看看,性价比更高,坏了也不心疼。”用户瞬间就会被击中,原来这个AI是真的站在我的角度考虑问题的,信任感由此慢慢建立。所以陈历飞给自己产品的定位是“智能买手”,而非“智能销售”,一切出发点都是为用户服务。

但陈历飞也明白,信任的建立是一个长久的过程,尤其现阶段大语言模型还有一些“幻觉”存在,但随着技术发展,问题一定会被解决。他身边还有很多创业小伙伴,有的是做AI求职的、有的是做AI相亲的,还有医疗、法律相关的。他总结说:“我们所有大语言模型相关的创业者,都是一起在推动人类对AI的信任关系建立。”

02

千帆竞发,百舸争流

“我在Facebook学到了很重要的一点,那就是run fast,先跑起来再说。” 陈历飞说,直到现在仍然很多人工智能领域的创业者还在思考、打磨BP,而他的产品已经上线3个月了,跑通了MVP(Minimum Viable Product最小化可行产品),积累了几千个用户,还赚取了一些佣金。陈历飞参加“文心杯”创业比赛的原因也简单,他希望能获得一些资金和资源的支持:“而且以后我们要做国内市场,也肯定要换成国内的大语言模型。”

与陈历飞的Buysmart.AI一起进入决赛的,还有高品质AI平面设计及创意生成平台Nolibox、人工智能驱动的新材料发现平台幻量科技、面向药企的“生成式AI医学内容引擎” 零假设、基于文档智能的专业知识问答助手及阅读平台ChatDOC、面向大模型的中间件服务Vanus AI、AI-Native亚文化兴趣同好创作社区Genie AI等。这些项目大部分为天使轮、pre-A轮等早期项目,也包括成长期、中后期的成熟项目。

创业者们普遍对文心大模型的表现给予了高度评价,ChatDOC CEO林得苗表示:“有客户问我们,国产大模型中哪个效果比较好。我就直接拿我们的产品出来,说我们接入的是文心一言,你也可以试一下。”零假设CEO顾飞说:“有的大模型一提到开放API(应用程序编程接口)的时候,就不愿意开放了。而百度愿意开放出来API,是对自己实力感到自信的表现。”

百度确实有自信,多家权威机构的报告里,文心大模型的表现都可圈可点,并在某些方面的评分超过了ChatGPT。IDC发布的《AI大模型技术能力评估报告,2023》里,文心大模型拿下7个满分,综合评分第一、算法模型评分第一、行业覆盖评分第一。而且就在不久前的8月31日,文心一言率先向全社会全面开放,所有用户直接可以体验;企业级用户也可以直接登录百度智能云千帆大模型平台官网,调用文心一言能力。

44

IDC《AI大模型技术能力评估报告,2023》,百度7项满分、综合评分第一

9月5日百度智能云千帆大模型平台宣布实现2.0全面升级,首次公布月活企业数已近万家,覆盖金融、制造、能源、政务、交通等行业的400多个业务场景。而本次大赛的选手正是通过百度智能云千帆大模型平台调用文心大模型能力,打磨垂直应用。

百度已经在人工智能领域耕耘十余年,有着深厚的技术及资金实力。纵观全球,从芯片层、框架层到模型、应用层,百度是唯一一个全栈布局的人工智能公司。所以也只有百度,能做到“号令一发,群雄云集”。作为大赛的主办方,百度希望用自己积淀多年的大模型技术为创业者奠定坚实基座,与创业者共创、共建,共同打造开放繁荣的AI大模型生态。

如今环境下,大模型的竞争已经从拼参数、拼规模阶段,发展到了拼应用和拼场景阶段。OpenAI的CEO Sam Altman表示,现阶段是他见过的创业的最好时机,唯一可能媲美的是互联网刚普及的早期,他说:“创业公司会获胜,一切皆有可能。”

李彦宏非常看好人工智能应用在国内的发展前景。他表示,模型本身是不直接产生价值的,基于基础大模型开发出来的应用才是模型存在的意义,对于创业者来说,“卷大模型没有意义,卷应用机会更大”。他分析说,移动互联网时代操作系统只有安卓和iOS,但特别成功的应用却很多,只有在大模型基础上产生足够多的AI原生应用,才是一个健康的生态环境。

越来越多的创业者正在进入人工智能应用层创业,未来中国会有自己的人工智能生态系统,而百度文心大模型一定会是开发者们最强有力的坚实后盾。目前人工智能的发展才刚刚拉开序幕,当下属于人工智能应用的拓荒期,也是最好的创业时代。