大模型企业“养成记”
2023-10-23 16:33 来源:法人杂志 作者:李辽

◎文 《法人》杂志全媒体记者  李辽

人工智能正在改变世界,人工智能技术正在成为社会各个领域的重要应用之一。近几年,在大模型(指具有庞大参数规模和复杂程度的机器学习模型。在深度学习领域,大模型通常是指具有数百万到数十亿参数的神经网络模型)催热的新一轮人工智能技术浪潮中,中国民营企业大量涌现,迎着政策东风崛起,在国家的培育和扶持下成为细分市场的排头兵。对于这些民营企业来说,这无疑是一个最好的时代。

图片

▲2023 世界人工智能大会现场 CFP

“大力出奇迹”

2018年年底,乙壤月创立了瑞泊(北京)人工智能科技有限公司(下称“瑞泊”)。5年的成长时间听起来并不长,但却让瑞泊在大模型领域成为“元老”。

大模型属于人工智能的子领域,之前并非主流,今年在ChatGPT爆火后终于“出圈”。“这波热度来得比我们预想要快。”乙壤月对《法人》记者坦言,“在大模型这个赛道会感到很孤独。今年之前,全国做大模型的不到200人,全球不到2000人。在获得实质性突破前,大家都像在茫茫大海中寻找新大陆。”

做大模型需要投入巨大的人力物力,又极难取得技术突破。“你不知道赛道何时能成为主流,在不被看好的情况下,坚持显得尤为重要。”

出于对技术的判断与执着,让乙壤月坚信“大力出奇迹”,只要坚持大量训练和投入,终有一天会从量变到质变,“如同培养一个孩子,他总会能力涌现”。而这个孩子离不开大环境的鼓励与关照。

2021年10月,中共中央政治局第三十四次集体学习中提出,“要站在统筹中华民族伟大复兴战略全局和世界百年未有之大变局”的高度,推动我国数字经济健康发展,要推动数字经济和实体经济融合发展,发挥数字技术对经济发展的放大、叠加、倍增作用。

如今,大模型领域百花齐放,但也鱼龙混杂。在现阶段,从国家层面来讲,对这类企业最大的扶持就是制定规则。为促进生成式人工智能健康发展和规范应用,今年4月,国家开始征集各方意见,很快在7月由七部门联合发布《生成式人工智能服务管理暂行办法》,划定了底线,并表态将推出有效鼓励措施。

该办法中,“使用具有合法来源的数据和基础模型”,以及既要“鼓励生成式人工智能算法、框架、芯片及配套软件平台等基础技术的自主创新”,又要“平等互利开展国际交流与合作,参与生成式人工智能相关国际规则制定”等内容,也是乙壤月的建议。

他认为,中国训练出的大模型应该具有社会主义核心价值观。为推动生成式人工智能向上向善,他还建议国家对大模型及相关应用服务实行包容审慎和分类分级监管。“领导们非常愿意听取我们的声音。在接待主管部门调研时,本来只给我们预留了半小时的时间,但最后有关部门耐心地听我们讲了四五个小时。”

为鼓励企业创新,同时规范市场,今年5月至7月,北京市经信局分两次公布了北京市通用人工智能产业创新伙伴计划成员名单,瑞泊赫然在列。北京市工信厅、中关村科技园区管委会及北京市科委时常会将瑞泊这类模型伙伴以及算力伙伴、数据伙伴和应用伙伴聚合到一起,举办对接会议,可谓是“政府搭台,企业唱戏”。

找方向、找钱、找人

“创业的核心就是找方向、找钱、找人。”大模型应用软件葫芦笔记创始人、连续创业者陈顺利说。

2019年,陈顺利的第一个创业项目失败。在解散了创业团队一年多后,他又开始了一个新的项目,灵感来自他在2015年为了解决自己的需要而编写的第一版葫芦笔记程序。

“我的记忆力很差,但梳理项目需要记忆容量。”作为程序开发者,他发现自己有一个特点,就是能把机器的优点与自己的缺点结合起来,于是他开发出葫芦笔记,把大量不确定的思维展开成有向图,从中梳理出有用的结果。之后,只要使用葫芦笔记,遇到再复杂的项目、再多人员的分配他都不再恐慌。“我觉得这个软件可以开放给其他人,用工具使大脑得到延伸。”

2020年3月,葫芦笔记项目正式启动,陈顺利成功申请到位于中关村的智优沃孵化器,“减免一年租金”的优惠政策对于初创公司来说非常友好。为了解决找人的难题,他经常参加清华大学和北京大学组织的路演活动,找到认可自己价值观的一群人,邀请加入团队。“找合伙人需要上前搭讪,如同找合适的情侣,但这一步必须迈出,合伙人可以弥补你的不足,带来学识,带来资源,降低风险。”

孵化器管理公司几乎每周都会为葫芦笔记安排一些创业者路演大会,同时也会向北京市政府和国家对口部门推荐该项目,增加葫芦笔记曝光率。

通常来说,人工智能产品迭代速度很快,三天一个小版本,一周一个大版本,一月一个超级大版本。“这样的迭代速度,才会让团队对产品抱有信心。因为产品迭代速度决定了团队的拥护度。”为筹集产品开发资金,陈顺利卖掉了名下唯一房产。2021年8月,葫芦笔记终于获得百万级天使轮融资,但直到2022年1月付费版本推出,包括陈顺利在内的4位核心成员才开始领取工资。

葫芦笔记是一款为爱思考的人提供的知识管理平台,帮助团队开发者、金融合作者梳理项目,帮助老师学生撰写论文,用户群体相对小众,但精准用户数量已经突破10万+。“北京有人工智能发展的土壤,是一个大模型创业企业的天然培养皿。”陈顺利感慨地说。

找寻差异化价值

过去10年,人工智能模型平台的创业者范向伟在软件行业看到了两种发展模式,一种是“对标北美”,一种是“快速做大”。他发现,这两种模式都有很大的副作用,容易走向产品驱动发展的对立面,让企业难以持续发展,“而这正是中国软件行业存在的问题——没有很好平衡自我和客户、短期和长期的关系”。

2015年,中国以大众创业、万众创新带动新经济增长。围绕“双创”,国家相继出台了一系列指导文件,从中央到地方,各级政府从企业登记、创新孵化器、风险投资、融资、税收等多方面出台了鼓励政策,为创新创业“松绑”。范向伟所在的上海交通大学有大量的创业培训、创业辅导和创业比赛,创投基金也十分活跃。当时正在攻读研究生的他参加了创业比赛,拿到了较好名次,读书期间便获得了风险投资。

随即,范向伟创立了和鲸科技(下称“和鲸”)。但大学生创业团队却在这时暴露出短板,容易高估技术的发展速度和决定性作用,相信只要技术能够快速发展,市场就一定会接受。而真实情况是,“有可能别人也研发了一个比你更好的产品,也有可能你以为客户有这个需求,但他其实没有,或者他自己以为有,但后来却发现没有。这些现象都很常见”。

和鲸走了很多弯路,启动创业后的三四年里,一直在寻找一个有前景、有深度、有刚需的细分市场。“寻找的过程很痛苦,我有过多次情绪崩溃的时候,陷入了自我怀疑。”范向伟说,产品研发每年要投入几千万元,如果不能将这些研发成果转化成营收,就无法向市场证明团队具有商业能力,后续很难争取到新的融资,研发只能放缓,难以跟上技术发展的浪潮。

痛苦还来自选择。当时和鲸接到很多来自金融、电信行业的头部企业的大额意向订单,但条件是需要和鲸投入所有资源和精力。深思熟虑后,和鲸选择放弃。很多同行和投资人,一直不能理解,为什么和鲸选择进入教育和科研这两个行业,而不是金融、地产、零售等更有钱、信息化程度更高的行业。当时,范向伟的判断是,机器学习、数据科学在中国还是一个很早期、很不成熟的产业。金融、地产、能源等成熟产业,虽然预算很高,但有大量定制化需求和运维服务需求,标准化的工具产品还不是当前的刚需。

为了在这个高速增长、高度竞争的行业站稳脚跟,和鲸选择在产业需求爆发前,提前布局这个产业最核心的生产要素,也就是技术人才和科研机构,同时耐心地进行产品的打磨,完成局部市场的产品验证之后,再进入更大、更厚的产业。

通过两三年积累,和鲸的ModelWhale成为教育和科研领域最有竞争力的人工智能模型平台的产品提供商,形成了差异化优势。“我们的客户都是国家队,他们要为国家树立标杆,为国家探索科技前沿方向,引导行业科技创新。而他们选择了我们,就是我们处在这个时代的幸事。”

编审|渠 洋

责编|白 馗

校对|张波  张雪慧

编辑:刘晓莹