本文作者:admin

李涛:为千行百业训练出各种各样的垂直模型

admin 2024-09-14 08:21:02 41
李涛:为千行百业训练出各种各样的垂直模型摘要: ...

  2024年服贸会专题论坛之一——“2024中国AIGC创新发展论坛”于9月13日-14日在北京举行。APUS董事长兼CEO李涛出席并演讲。

  李涛认为,个人工智能发展会呈现出两个方向:第一是下一代大模型已经初显端倪,第二是人工智能的应用到了关键时点。“对于非常多的通用人工智能企业来说,大模型有很大的机会可以击穿行业壁垒,我们以行业数据进行学习、训练,作为大模型企业可以真正为传统行业提供服务,进行AI赋能”。

  李涛强调,APUS作为一家全球化的AI企业,在技术上非常明确,要有所为、有所不为,只做三个方面:第一个方向是多模态。第二是专注于端侧AI。第三是在算法上进行优化。

  “毋庸置疑,人工智能已经成为今天新质生产力最典型和最杰出的代表,APUS也是希望用APUS通用大模型作为底座,为千行百业能训练出各种各样的垂直模型”,他说。

  以下为演讲实录:

  李涛:大家好,很开心今天下午在这里跟大家一起来讨论AIGC在新质生产力方向的一些应用。APUS过去十年一直是在互联网出海,大部分业务都在海外,当然在现在这样一个人工智能快速兴起的时间段,APUS也把自己的全球业务与人工智能充分做了一些结合。因为今天我们是讨论AIGC与产业的结合,我想首先分享一下我们的一些观点。

  第一个,从目前来看,我们认为现在整个人工智能的发展大概会呈现两个方向,尤其是我觉得在中国第二个方面会更重要一些。第一是我们能够看得到下一代大模型已经初显端倪。过往基于无监督和有监督的学习、训练的大模型,到目前为止已经遇到了一些障碍,我们知道OpenAI的Strawberry拖了很久,今天早上我们看到o1的发布,为什么?原有基于算力、基于大数据,不断的拉大参数的训练模式遇到了一个比较大的瓶颈。当然我们看到下一代的大模型更多是基于左右互搏、自我对弈的强化学习很快会登上舞台。今天凌晨o1发布证明了这一点。从而通过这种方式能够让大模型在原有的基础之上能够更强的增强它的逻辑推理能力。

  第二个方向最重要的是人工智能的应用,现在到了关键的时点。我们一直有一个观点,人工智能大模型到来以后有一个非常强的能力(在过往),过往整个信息产业无论是计算机还是互联网都会面临一个很大的问题,就是行业壁垒。但是大模型到来以后,对于非常多的通用人工智能企业来说,大模型有很大的机会可以击穿行业壁垒,我们以行业数据进行学习、训练,从而让我们真正地作为大模型企业,为传统行业提供服务,进行AI赋能。刚才邬贺铨院士和前面几位嘉宾谈了这个方向非常多的观点,大家也看到了非常多的案例,所以我在这儿的第一个观点是,可以看得到,基于自我对弈的强化学习正在成为下一代大模型的一个基本模式。我们知道传统大模型的训练模式主要是靠拉大算力、拉大参数、加大数据量来进行。实际上我们也能看到,目前为止Strawberry遇到非常大的障碍,换句话说以前固定成本很大,边际成本趋近于0,这种模式现在来看已经发生了非常多的问题。我们也知道全球非常多的,比如OpenAI、谷歌Jsonnet、cloudy也好,都已经把算力拉到10万卡。再往下怎么办?难道拉到100万卡、1000万看?恐怕这种模式根本无法真正的运行下去。我们也知道,现在有一个说法,2500万张H1就可以把地球上所有电力都给消耗完,从这个角度来说,现在基于无监督学习和有监督学习的传统的、大力出奇迹的训练模式已经走到了尽头,这是为什么今天看到人工智能学习大量数据时能起到一定作用,但一直解决不了大模型的幻想问题。那么怎么解决这样的问题?这是第一个。

  第二个,在未来所谓的行业数据包括物联网传感器数据引进来的时候,包括具身智能,我们知道人工智能大模型开始真正从物理世界大规模拿到感知数据时,如此大的计算量怎么解决幻想问题?所以已经看得到全新模式已经出现了,让大模型之间自己左右互搏,让它以自我对弈的方式强化学习。所以我们也可以看得到,大模型整个未来的训练模式已经从原来的训练、微调、强化学习开始转化为训练微调和自我对弈的强化学习。在传统模式下强化学习是在认知能力拉齐上做的强化学习。后面我们看到下一代人工智能大模型应该更多是以自我对弈的强化学习,有点像早期的AlphaGo和AlphaZero,最开始连普通棋手都下不过,但40天之后就战胜了柯洁,过程中本质上训练模式就是用大模型自我对弈来完成的。换句话说,今天我们的大模型实际上正在把我们过去通过自我对弈的方式把我们大模型本来不强的逻辑推理能力正在快速拉强,这是我们可以看得到的一个非常大的趋势。今天早晨OpenAI发布了ChatGPT的o1,我们看到o1最大不同是,它的数学、物理、化学甚至包括coding方向实际上都比原来GPT-4o有了非常大的提升,甚至在很多专业领域已经超过了人类专家的水平。这是我们看到的自我对弈强化学习带来大模型的一次全面的飞跃,而且我们比较相信在这种飞跃情况之下,大模型原来不擅长的,比如说可能会经常出现幻想的领域,今天下一代模型是可以很好解决的。包括有很多我们原来说的,可能是用一些确定性的小模型才能解决的问题,并不是所有问题都要大模型来解决,今天大模型通过自我对弈的学习方式可以快速地把自己这方面的专业能力提升。这是我们看到人工智能大模型在下一步发展中的趋势。今天早晨o1发布已经证明了我们这样的基本判断。

  另外是人工智能在产业的应用,刚才大家举的例子,包括在电力的巡检、在金融、在零售,非常多。除此之外,我们知道人工智能包括在医疗、教育、电商、制造,甚至舆情、农业都会有更大的产业方向。特别是对于中国来说,我们今天面临一个比较大的问题,一个是整体大模型训练的技术、能力甚至我们在大模型的创新上,相对于全球最领先技术来说还是有一些落后的。第二个是我们非常明确的,就是我们在算力上有着非常大的差距,现在算力因为各种各样禁运的原因,中国所有的大模型企业到今天为止很少说有能够把算力拉到10万卡以上。换句话说,即便是在传统的大力出奇迹的模式之下,我们的卡数是完全不够的。但是在大模型整个人工智能发展路径里面,存在一个三角形模型,人工智能要想发展得更好,我们有两个三角形模型,一个是大模型三角形模型:算力、算法和数据。人工智能的产业发展的三角形模型是:算力、算法和应用,而且在整个三角形模型里面我们只要补足任何两点都有机会把整个商业闭环给完成。从这个角度来说,今天中国最有机会也最应该把人工智能产业应用给做好,一方面是补足我们算力不足情况,能够让我们整个闭环持续发展下去。另外一个是因为中国有海量的用户、有海量的应用场景,我们是全球制造业大国,我们有足够的应用场景可以把大模型各种应用模式能够真正总结出来。也正是因为这样的原因,APUS在过去两年里面,非常坚定的在整个人工智能产业应用的领域把人工智能的战略定位在产业应用和生态建设上。可以看得到,从去年4月份APUS发布了第一个1000亿参数的多模态大模型,应该是中国最早发布多模态大模型的企业。一直到今年我们发布了APUS 4.0 mini,是一个端侧大模型,120亿参数,可以在整个断网情况下在电脑笔记本上很好地工作。当然也非常幸运,我们拿到了两张通用大模型的牌照,一个1000亿参数,一个2100亿参数,我们也希望通过我们的通用大模型能够真正为千行百业来赋能,为各种各样的垂直领域的企业也好、政府也好、单位也好能够提供更好的服务。当然更重要的一件事情是,我们马上会把我们的Omni发布出来,就是APUS大模型的5.0,就是刚才我谈到的基于自我博弈的强化学习的大模型,从目前我们已经看到的水平来看,达到了或者超过了GPT-4o,但成本只有它的20%,我们希望这样的大模型能够在中国各种生态里面得到充分的应用。

  APUS在整个人工智能的应用,刚才谈到了我们在人工智能的产业应用和生态建设上,我们第一件事情是,我们用人工智能对APUS在全球覆盖24亿用户的200多款产品进行了应用升级。过去十年我们一直在海外做业务,大概有200多款应用,覆盖了200多个国家和地区,25种语言,应该说现在在全世界每天大概就有将近4亿用户在手机上使用APUS的应用,我们也通过APUS大模型对所有应用进行重构,这样的重构一方面给用户带来更大的产业价值,另一方面也非常幸运,因为这样的全球用户给我们提供数据训练,从而能够用最新鲜的、最真实的数据能够对APUS大模型进行训练。当然过往用户绝大部分分布在东南亚、南亚和中欧一些国家,随着人工智能的广泛应用,APUS的一些应用从去年到今年在美国、在欧洲也取得了非常长足的进步。我可以给大家举一个特别简单的例子,美国超过600万家庭在读的电子圣经都是APUS提供的,在电子圣经里面我们通过人工智能的提供包括伴读、绘本、AI牧师,然后为这些家庭通过对基督教的AI化,能够真正地实现对这些家庭的圣经阅读和祈祷的服务。这是我们在C端的一个很小应用。另外一个方面我们关注人工智能和在产业、行业应用里面能够做哪些事情,过去一年半时间APUS连续发布了11个垂直大模型,这11个垂直大模型里面可以给大家分享,比如云梦创作大模型,目前已经跟一家国内的上市的影视企业合作,如果大家最近看《唐朝诡事录》电视连续剧连绵用到APUS技术,整个影视集团用APUS AI进行影视剧变局包括场景助力,这是我们的应用场景。另外APUS AI跟网信办合作做网信办模型,在关键的辟谣助手包括续建新闻处理上来做智能的识别和处理。当然我们现在也为网信办提供人工智能大模型训练靶场,很多垂直大模型训练上,最后再真正投入商用、投入在线服务的时候,能够提前在靶场上经过一系列的训练。除此之外,APUS医疗大模型已经在一些三甲医院开始使用了。

  所以APUS在未来作为一家全球化的AI企业,我们给自己确定的战略非常清楚,在技术上APUS非常明确,有所为、有所不为,我们只做三个方面:第一个方向是多模态。我们认为未来人工智能无论是到具身智能,还是对物理世界的感知和处理应用上,应该说都是多模态的,所以APUS从去年第一个1.0大模型发布的时候就一直专注于多模态上。第二,APUS专注于在端侧AI上,我们为什么要做端侧AI?最近大家知道iPhone16发布,所有功能在国内不能用,iPhone16在欧洲根本就不发布,根本原因是因为它的AI功能会大大获取用户数据,你可以想象一下,有一天你在手机上输入的每一个字、讲的每一句话、打开的每一个网页、用的每一个APP,你的一切行为都会被用在大模型训练,甚至有可能你在手机上输入的一行字,最后你并没有发出,也会被拿来做大模型的训练。这对很多重要的VIP人士来说是不可接受的一种状况。正是因为这样,APUS非常明确,我们很多就是在端侧,为一些重要的人士通过大模型,千亿参数大模型的剪裁,剪裁成为放在手机或者我们笔记本里面的一个在断网情况下可以工作的大模型,从而在保证数据安全、隐私安全的情况下同时能够提供智能化的服务。第三,我们非常清楚,如果在中国甚至在中国之外非常多的新兴市场国家,如果要把人工智能这件事做下去,算力是非常重要的一件事情。所以我们比较专注,主要在算法上进行算力优化。刚才大家看到了我们的APUS 5.0,也就是Omni马上就要出来了,在现有GPT-4o达到同样水平的时候,能够把整个算力需求降低80%只有它原来20%。当然在市场方向我们非常明确,第一件事APUS业务在海外,把我们对所有海外的C端业务进行重构。

  第二我们会关注医疗,认为人工智能在医疗领域是目前最广泛,对社会经济社会生活影响最大的,中国现在有两个领域是非常迫切需要的,一个是医疗,一个是法律,原因很简单,我们在北京感受不到,但不可能全中国人都去协和、301这样的好医院来看,中国大量普通人在边远山区,在区县里不能得到好的普惠医疗服务。通过人工智能的介入,从而能力真正让普惠医疗,可能不能做到100分,但能把边远地区的30分、50分的医疗水平直接给拉到80分、90分,从而真正让普通人真正想象到跟一线城市同样的医疗服务水平。第三就是AI PC,我们端侧大模型主要预装在笔记本电脑、手机上,后面会有专门介绍,现在简单说一下,APUS AI PC目前已经在一些部委开始投入商用,主要是针对一些部委有严格的数据隐私要求的外勤提供智能服务时,我们提供的。第四,APUS的主权AI,我们在为特定的国家来定制整个国家的通用大模型底座。我们也希望通过这样的方式来做。中国从十年前的互联网到今天的人工智能,相对于美国来说还会明显落后,但相对于世界来说应该是足够领先的,所以我们有能力让我们的人工智能走出去,为一些可能发展中的国家甚至欠发达国家通过人工智能为他们构建信息化甚至智能化的基础设施。

  我刚才已经讲了,我们现在正在做的是一个非常重要的战略方向,就是AI医疗。APUS经常对外讲我们做的这件事大概用一百天,实际上这件事差不多用了一年时间,从开始定这个方向,拿数据、清洗数据,跟医院合作,到目前为止,基于6000亿高质量的医学数据进行了增量预训练,当然也通过360K的微调数据来提高我们新模型的能力。在这里特别强调,在今年采用了基于反馈的强化学习提高我们的医疗大模型的能力,可以看到两个很重要的数据:一个是医疗大模型参加全国医师资格考试可以考到77.5分,我们也同步用GPT-4做测试只能考到61分,什么水平呢?差不多是一个医科大学毕业十年左右医生的诊疗水平。也正是因为这样,所以我们在过去半年里面已经在一些三甲医院落地开始使用,而且到目前为止在线处理了30万条诊疗的记录,基本上工作模式也特别简单,大部分病人可以在医院公众号和小程序里面直接询问病情,AI会直接给出病情诊断,同时直接帮病人进行挂号,病人通过我们的大模型拿到初步诊疗和挂号之后,在挂号时间直接到医院,见到医生之前医生就看到所有病例和人工智能诊疗的意见,这样能极大提升医生的整个处理能力和水平。而且在整个过程中,实际上AI医疗模型跟医生之间形成了一个相互反馈和相互校正的过程,而避免出现误诊。

  我们还做了另外一件事情就是中医药,我们用了超过2000亿条的数据,包括所有中医的医典、理论数据、药典、病例进行。我们也能看到参加中医的资格考试考到了80分,GPT-4可能不擅长中医,考的不及格,是49分。正是基于这两个模型,APUS在医疗方向大概推出了一个医疗样板间,就是2+5+N,通过APUS的岐黄大模型和智草中医大模型来提供基础服务。当然,通过我们的医院场景,药企的场景,专业病的场景,包括中医的场景和用户家庭健康的场景这五个场景,能够真正为普通的病人、病患,包括普通人提供家庭医疗、甚至包括日常的健康管理。可以看得到,非常典型的是进行智能诊疗、智能审方、智能诊断,包括对所有图形进行识别,并且给出诊断。现在跟一些药厂合作做新药的研发实验。除此之外我们也利用中医进行舌苔诊断和脉象诊断,我们希望能够真正作为普惠医疗或者家庭健康一种非常好的保证状态。也希望能够把整个APUS医疗大模型服务能够推进到中国更多公共医疗领域,无论是给更多的医院服务还是给更多的药企来提供服务,包括普通人、普通家庭的医疗保健工作。

  另外一个是AI PC,这是一个重要的应用场景,在一些专业领域用我们的端侧大模型+端侧大模型Agent+专业数据,真正能够为一些特定的行业、特定的行业和特定的部门提供一些服务,一个是在野外、海上,可能联网不方便。另外对于一些特定有极强安全要求的,比如国防、安全等部门提供服务。当然我刚才讲到,这个产品不方便提名,已经在实战中给一些部委投入到批量的使用中。

  第三个,前两周中非论坛,我们跟南非、乌干达、加纳达成战略合作,并为这些国家提供通用大模型底座。提供这些通用大模型底座也确实帮我们拓展了非常多的应用场景,我们以前从来没有想过人工智能可以用在签证、海关的监督管理上,这些需求帮我们完善了,主要为这些国家第一提供通用的模型底座,第二为这些国家提供垂直模型训练,南非主要在医疗、金融、海关签证等等这些领域。当然在这个过程中,我们也提出来APUS人工智能的三大核心价值观,第一个是智能向善,大模型必须要做好事情,不能做坏事情。第二个要跟主权AI价值观对齐,这个不仅仅是中国国家的要求,事实上不同的,在我们看来大的政治、文化、经济主体都应该有自己的主权AI,都应该与自己的价值观对齐。比如我们为加纳训练的大模型,整个大模型里面必须对两个宗教价值观有支持,一个是基督教,一个是伊斯兰教,在中国大模型是另外一回事,在加纳是不同的价值观对齐模式。在南非的价值观对齐跟加纳的价值观对齐完全不一样。除了提供这种通用大模型底座和垂直大模型应用以外,我们也会帮助他们来建立最基础的算力平台,所以APUS在这个基础之上,上个月刚刚发布了异构万卡算力平台,希望通过这样的技术真正能够做到人工智能出海,而且为非常多的新兴市场国家提供人工智能的基础设施。

  除此之外,我们在美国、欧洲也在探索一些新的业务模式,比如电商大模型,可以给大家看一个案例,这款产品叫Swapper,在美国发布的智能电商,所有模特、场景都是AI形成的,可以一键换装、一键换肤、一键换背景。当然配套的Swapper我们还做了智能客户。我记得刚才邬贺铨院士也谈到了,我们希望通过这样为中国出海的企业。当然现在这个产品主要发在美国,为大量美国的中小企业点上服务来提供支撑服务。

  (现场播放视频)

  可以看到人工智能今天在整个电商服务商已经有非常非常卓越的表现,无论是让商家还是让用户有非常好的表现。

  这是APUS农科大模型,目前为止已经可以做到全球14万种的植物,识别准确率超过了95%,并且对所有农作物和植物的病虫害都可以快速地进行诊断,能包括出诊断和治疗的方案,准确率有超过了92%。目前我们正在把这个在中国一些重要的农业省份进行推广。除了这个之外,我们现在也跟一些省份基于我们的中医药大模型和弄可达大模型正在训练另外一个,可能大家很难想象,是食品大模型,中国有非常多的地方是食品大市或者大省,供应着全中国非常多的食品,这些食品的安全、创新、营养,过去都是用一个非常传统的方式、非常长的周期进行研发,今天我们用人工智能助力这些传统食品企业进行他们新产品的研发包括营养的配置,包括对食品安全的溯源等等,我们都希望用我们的食品大模型来做。这个不出以外,在年底之前,食品这个有很多挑战,我们应该会把这个发布出来。

  以上是整个APUS在人工智能产业应用里面所做的工作,今天我们讨论的是AIGC与新质生产力,我想,毋庸置疑,人工智能已经成为今天新质生产力最典型和最杰出的代表,APUS也是希望用APUS通用大模型作为底座,为千行百业能训练出各种各样的垂直模型。当然我也希望能够跟今天在座非常多的合作伙伴一起合作,能够真正做到AI出海,把我们的人工智能带到海外去,因为在全球市场还有更大的AI产业空间能够成为我们大家驰骋的天地,谢谢。

  新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。

阅读
分享