yabo官网科技创新是发展新质生产力的核心要素。在这个由数据驱动、智能先行的时代,正成为突显科技创新、推动社会进步的重要力量。从东部沿海到西部腹地,中国AI产业的发展呈现出地域特色与多样性。
成都,作为西南地区的科技重镇,正以其独特的魅力和潜力,在AI领域悄然崛起。
从今天开始,金融投资报特别策划推出“发展新质生产力·寻找成都AI大模型”系列报道,走进成都的AI企业,与行业领袖对话,挖掘他们的成长故事,感受他们的创新精神。从备案企业的突破性技术到市场应用的前沿实践,从政策扶持到产业生态构建,全面展现成都AI产业的活力与韧性,深入探索成都AI产业的发展现状与未来趋势。这不仅是对成都AI实力的一次巡礼,更是对中国AI发展版图中不可或缺的西部篇章的深度解读。
成都考拉悠然科技有限公司(下称“考拉悠然”)是一家专注于核心技术的创新型企业,由欧洲科学院外籍院士申恒涛教授领衔的团队创立。自2017年成立以来,考拉悠然一直致力于多模态AI核心技术研发和产业应用。
基于20余年的技术沉淀,考拉悠然自主研发了OSMAGIC码极客多模态操作系统,这是业界首款操作系统,能够实现从场景化需求到应用上线的端到端全流程赋能。码极客系统通过模块化拼装,大幅降低了AI算法的生产与应用门槛,使得AI技术能够快速落地于高端屏显、烟草生产、轨道交通、城市治理等行业,为这些行业提供高效的AI赋能。
近日,为进一步了解这家在AI领域中快速崛起的成都企业,考拉悠然首席架构师谢治宇接受了金融投资报记者的专访。
金融投资报记者:市场流传着这样一个观点:AI竞争到最后比的是算力。您是如何看待这个问题的?
谢治宇:我不太认同这个观点。因为人工智能的三要素,即算力、算法和数据,都是缺一不可的。从供方和需方来看,好像都是在竞争算力,但是它不是最终形态,算力肯定会解决。拼到最后,拼的不是服务器的数量,服务器的体量,而是拼的算法效果。以后拼的是解决业务的需求、直插用户核心需求的能力。
谢治宇:我们还在不断探索中,不过我们有一个不错的起点。之前我们做了不少针对不同行业的大模型,这样一来,不管是客户还是最终的用户,我们都与其保持着紧密的联系,产品和市场需求是同步的。我们的目标很明确,就是想打造一个各行各业都能用得上的通用大模型,帮助客户实现他们想要的功能。
金融投资报记者:每个行业都有它的特殊性,考拉悠然怎么解决行业差异化的问题?
谢治宇:通用大模型就是我们的基石。有了这个基石,我们就能针对不同行业进行深入定制。比如安全生产这个领域,可能涉及的就是钢铁制造这样的行业。我们的目标是,当这个大模型交付给客户时,我们不仅仅是提供一个模型,还有一整套工具链,帮助他们把模型应用到实际业务中去。
不过,我们不是什么都包办,我们提供的是一个服务平台。这个平台可以由我们自己来搭建,也可以通过合作伙伴来实现。目前让客户自己去做这个连接工作还不太现实,因为有一定的技术门槛。比如说,有些IT厂家对传统的OA系统很熟悉,但如果要加入AI能力,比如用自然语言查询人力排布情况,这就需要跨越较高的技术门槛。我们提供的服务平台,就是为了让这些IT厂家能够快速地将AI能力集成到他们的系统中,满足终端客户的需求。这样一来,IT厂家就能够更加便捷地为客户提供服务,而不需要从头开始自己研发复杂的AI技术。
金融投资报记者:所以,考拉悠然的技术实际上是通过技术来赋能场景,而不是单纯地给场景赋予技术?
谢治宇:这个关系是双向的。我们不仅用技术去赋能场景,同时场景也给我们的技术提供了反馈和输入。就像以前做AI或者技术产品的公司那样,我们的销售团队先去前线铺路,然后售前团队去引导客户,了解他们的需求。这些需求反馈回来后,我们的产品团队就会设计产品,技术团队接着去开发。
这个过程是从场景出发,再到技术层面。比如我们的视频全结构化产品,就是根据客户的实际需求来打造的。客户需要我们从铁塔上的摄像头捕获的视频里提取出关键信息,比如目标识别、行为识别等,把这些信息整合成数据资产,各个业务部门就能利用这些数据,比如交通管理部门会关注国庆期间交通拥堵情况,发生了多少交通事故;环保部门会关注是否有野生动物闯入。这就是我们说的从技术到场景的赋能。我们有这样的技术能力,同时也有多模态视频结构化、全息化的能力。
金融投资报记者:行业和技术之间,难免会遇到技术和场景不适配的情况,考拉悠然有没有遇到过这样的情况?又是如何做的?
谢治宇:肯定遇到过。但这个时候需要去做选择,有些场景我们暂时不做,让我们的生态合作伙伴去做。比如安防,我们现在就不直接介入了,因为这个领域里已经有友商做得很不错了,标准也很高。如果我们还用大模型去硬碰硬,就得在前期投入大量的沟通成本,这不太划算。
我们现在的重点是打造模型服务平台。这个平台能让那些特别懂行的合作伙伴,比如对公安业务很熟悉的团队,用它来给具体场景提供支持。这样,我们就不用冲在最前线,而是做了取舍。
金融投资报记者:我了解到你们有很多案例,比如地铁沿线安全监管平台,还有与安全生产相关的项目。不过,这些应用场景很多竞争对手也能做,客户为什么会选择你们?你们有什么独特的优势吗?
谢治宇:举个例子。在大模型出现之前,有一家深圳的上市公司想用摄像头来改善城市治理,看看有没有违规商贩、道路损坏或者垃圾桶满了之类的问题。他们最初的认知是,既然能做人脸识别,这些也应该没问题。但实际操作后发现,这里面有很多门槛,技术其实不是最大的问题,关键在于场景化的能力。
你想,在办公室里怎么可能模拟出所有的道路损坏和垃圾桶的情况?不管是AI还是现在的GPT大模型,都需要大量数据训练。就算城市里有这些数据,从一开始的60%准确率,优化到85%—90%,也需要投入大量的时间和人力,成本很高。
但我们的优势在于,有一套高效的系统,数据一回来就能快速进行增量训练。而且,我们有一套工具,能快速部署和更新模型。对客户来说,今天准确率是60%,明天可能就是70%,越来越精准,而且只需要7天时间。这不是随便哪家公司短时间就能做出来的,而是需要多年的经验积累。我说的就是我们的OSMAGIC技术。
金融投资报记者:OSMAGIC是考拉悠然的核心技术,其背后的逻辑是什么?而且,你们是怎么实现1+12的效果的?
谢治宇:OSMAGIC的核心目标很简单,就是要降低AI开发门槛,提高开发效率。现在很多公司,包括百度,都有类似的产品,能快速训练模型,甚至对外销售。我们的考拉平台也在提供这样的服务,但我们更专注于城市级别的中台,比如城市大脑、智慧农村这样的项目。
如果说我们的目标是让客户自己训练算法,那按照现在的情况,10年内都不太可能实现,因为让中间商或者渠道商来做算法开发,成本会相当高。
我们的优势在于,除了算法的准确率,我们更注重成本控制。技术上的难度其实并不大,关键是能不能在控制成本的前提下快速完成任务。有的企业可能花两三个月时间也能达到同样的效果,但我们的成本和速度是关键。我们的产品能快速地从数据采集到模型优化,这就是我们的核心竞争力。
谢治宇:我刚才讲了,我们的AI平台是基于OSMAGIC的平台,它能够缩短我们的模型从冷启动到满足客户需求的时间,这是第一点。第二点,做这个事情和算法工程师无关。我们的AIT团队在做,它的成本比算法工程师要低很多。所以,这两个因素叠加起来,就有营收了。
金融投资报记者:人工智能大模型的一个重要发展方向是小型化和专业化,这与考拉悠然的行业通用大模型的路径是否相悖?
谢治宇:这两者并不矛盾。我们做的行业大模型,本质上就是为专业化场景量身定做的。这两个目标跟我们的发展路线是吻合的。而且,我们在实践中发现,以前的小模型和现在的大模型能互相补充。比如,我们之前做的烟火识别,在晚上就容易搞混,因为尾灯和火光在摄像头里看起来差不多。但大模型就能分辨出来,因为它有更多的常识判断。
再者,大模型能帮小模型提高准确度。比如,我们让大模型和小模型一起工作,或者让大模型跟业务平台搭配,就能做出像BI助手那样的东西。你直接用说话的方式问它,“今天双流片区的网格员工作情况怎么样?”它就能直接告诉你答案。这些数据本来就有,不需要再专门去开发。
之前有部分公司把大屏和界面做得花里胡哨,但我觉得对于大模型来说,不管界面做得多花哨,最终还是要看它好不好用。我们需要的是那种能快速给出日报、月报,甚至小时报的实用工具。我们的通用大模型就像大学生,行业大模型就像研究生,到了具体行业里,它就像一个有经验的技术专家。我们的通用大模型对安全生产可能只知道一个大概,但行业大模型就融入了很多专业知识,包括各种标准、规章制度和实际数据。这样一来,我们的行业大模型就能在特定领域提供更深入的见解和应用。这就是我们的产品思路和商业模式。
金融投资报记者:所以,对你们来说,产业大模型的训练才是最关键的步骤,因为其他行业模型都是基于这个模型的。那么,在训练产业大模型的过程中,你们遇到过的最大挑战是什么?
谢治宇:最大的挑战就是建立一套有效的方法论。也就是说,得弄清楚用哪些数据能训练出什么样的效果。这个过程就像开盲盒,不确定因素很多,但现在我们已经研究出一套完整的方法了。
金融投资报记者:我国的AI产业起步相对较晚,与美国相比还有不小的差距。您怎么看待这个差距?我们应该如何缩小这个差距?
谢治宇:我认为主要有三个关键点。首先是人才。虽然现在很多重要的论文,前几位作者都是中国人,但关键是我们得留住这些人才。这就引出了第二个问题——我们的环境。我们需要创造一个能让这些有技术能力和学术深度的人才留下来的环境,给他们成长的空间,让他们能看到自己的职业发展与这片土地是相匹配的。
第三点是要引导这些人才去做正确的事。我们有了人才,也创造了适宜的环境,接下来就是他们要做的事情。我们不能只是一味追求做一些应用层面的东西,虽然这些东西从商业角度看可能很有吸引力,但也得有人去做那些基础的、需要长期沉淀的工作,就像芯片技术一样,这些底层的东西是必须有人去深入研究的。
金融投资报记者:说完国内外差距,那接下来我们聊一聊东部和西部的差距。您认为在西部地区发展AI产业相比东部有哪些优势和劣势?
谢治宇:西部地区的优势在于场景的丰富性。虽然东部地区也有很多应用场景,但很多已经被开发过,可能都已经进入到第二轮或第三轮的优化中了。而西部地区还有很多未被充分挖掘的场景,这就意味着有更多的机会。另外,西部地区的人可能还没有充分意识到AI能带来的提升和帮助,这种未被开发的潜力也是一个优势。再加上当地政府的大力支持和引导,我们有理由相信,西部地区的AI产业正处于爆发临界点。
至于劣势,可能在于整体的产业基础和配套资源上。东部地区相对成熟和完善,西部地区可能还需要时间迎头赶上。但从另一个角度看,正因为西部地区还在成长阶段,我们有更多的机会去引导和塑造这个产业的未来,这也是我们的一个机遇。通过不断地沟通和引导客户,我们有望在西部地区形成一些具体的成果,实现AI产业的快速发展。