“相信我们当中的很多人都试用过了ChatGPT,也相信很多人试用过之后,已经将它放置一边了,因为目前它和我们的工作基本上还是割裂的,所以用用就放下了。但我依然希望大家不要‘起个大早,赶了晚集’,因为这是一个会带来颠覆性变革的范式革命。”微软(中国)公司技术官(CTO)韦青在一场新书共读会上讲了这样一段话。
近,微软研究院负责人彼得·李和哈佛大学医学院生物医学信息学系主任伊萨克·科粗恩以及医学记者凯丽·戈德伯革写了一本书《超越想象力的GPT医疗》,主要讲GPT在医疗领域的落地和探索。
韦青的这段话里,包含了 “人性”“流程”“关系重构”几个关键词。事实上,这三个关键词揭示了席卷全球的大模型浪潮落地各个领域所面临的挑战。
大模型落地面临三大挑战 韦青这段话里包含的第一个关键词是“人性”。为什么大家对于包括GPT在内的新生事物都跃跃欲试?因为人大多有好奇心。又为什么试完就搁置一边了?因为人是习惯的动物,大多数人都不愿意走出舒适区,所以通常是‘起了大早,赶个晚集’,这是人性使然。对新生事物,只有少数人不仅能够勇于尝试,而且能坚持下去,并由此脱胎换骨。
第二个关键词是“流程”。我们要改变人性,很不容易,如果我们想让新工具、新技术、新思维对人或社会产生巨大的影响,就必须将之嵌入到现有的生活、工作流程当中。这样的嵌入、植入,是一个分拆、打散、重构的过程,需要很多探索和迭代。“GPT要在行业里用起来,要让每个人用起来,是非常难的事情,这涉及流程再造,而目前流程没有准备好。”韦青说。
第三个关键词是“新型的人-机关系范式”。GPT和过往的历次工业革命、新浪潮都不一样,过去工业革命带来的是新工具,而这次带来的是“新范式”,针对的是人的进化。机器的各种能力表现,会让作为人类的我们开始认真审视什么是人类真正擅长的领域和人类与机器相区别的能力边界,进而思考何谓新型人-机关系的问题。比如在医疗领域,过去只有医患关系,有了GPT,就变成了“你、我、它”三方模式。它犹如一面镜子,对于医生和病人,它都是一个新的角色。
NVIDIA Spectrum-X 网络平台是全球专为 AI 构建的以太网网络架构,对于生成式 AI 性能的加速是传统以太网网络架构的 1.7 倍
“人性”很难改变,但将GPT植入和嵌入现实社会的工作与生活“流程”当中,却是IT企业可以做也应该做的事情。事实上,在这一轮AIGC风潮中,OpenAI虽然风头很劲,但依然亏损。然而,有两家公司却吃到了红利:一个是英伟达,因为GPU是AIGC的算力支撑,所以英伟达市值飙升到万亿美元;另一个是微软,因为投资OpenAI微软市值已经突破了2.6万亿美元,目前微软正将AI嵌入到其各个产品线中。在今年5月的Build大会上,微软宣布将把其基于通用大模型打造的智能助手Copilot融入到自己的各个to B、to C的产品当中,包括Windows、GitHub、Bing搜索、Azure云等。作为一家提升生产力的公司,微软产品分布在生产力的各个场景中,GPT-4模型嵌入其产品线中,与业务和需求场景结合水到渠成。
目前全球范围内的“大模型”竞赛正拉开序幕。在中国,据不完全统计,参数规模10亿以上的通用大模型已经超过80个,如何将这些模型嵌入到各行各业正在高速运转的流程当中,重塑这些行业的“人-机关系”,是我们推动大模型落地需要思考的维度。
北京麦伽智能科技有限公司创始人罗成表示,今天AI看起来很火,很多企业都下场做大模型,但现实是投资相对冷清,与几年前投向线上打车、O2O、社区团购以及共享单车等赛道的资金相比,目前投向这个领域的钱还非常少,这一轮AI领域的投资逻辑并没有形成。
腾讯集团执行副总裁、云与智慧产业事业群CEO汤道生认为,大模型只是起点,未来,应用落地的产业变革才是更大的愿景。企业过去的研发、生产、销售、服务等环节中,有很多依赖人来判断、协调与沟通的地方,今天都值得去看看,哪些环节可以叠加AI的生产力,来提质、降本与增效。
急需“行业AI验证者” 今天,各行各业都需要AI助力解决难题。以医疗行业为例,医疗资源匮乏仍是一大痛点。仅仅依靠医生业余时间制作医疗科普短视频,要解决医疗资源的短缺是远远不够的。据估计,目前全球有近一半的人口——约40亿人,缺乏足够的医疗保健服务。
AI应用正在走向各行各业 GPT-4及相关的大模型产品所展现出来的潜力,让我们看到了用AI能够在很大程度上填补医疗保健服务的空白,尤其是在边远贫穷的村庄。目前,很多人获得健康相关的信息是通过网络搜索方式,如“百度医生”“谷歌医生”“医疗科普短视频”,如果通过大语言模型或许能够获得比医生或医学顾问更新、更全面的咨询。
仅靠说人的语言,GPT可以给人看病吗?前段时间,加州大学圣地亚哥分校进行了一项研究,研究人员在社交网站找到195个真实的医患问答,然后将相同的问题投喂给ChatGPT,再交给盲评,比较人类医生和AI的高下。结果ChatGPT在信息质量和同理心这两个方面,都打败了人类医生。
微软全球资深副总裁洪小文认为,AI至少将在四个方面为医疗行业带来改变:一是帮助医护人员更高效地为更多患者提供实时和精准的诊疗服务;二是为患者提供更丰富、更准确的医学知识、医疗建议和保健指引;三是帮助医疗后台支持体系的相关人员更快地处理医疗健康服务请求或是从各种诊疗数据中提炼洞察和结论;四是帮助研究者推进医学和生物科学的前沿探索,如新的靶向药物的研制、测试、患者匹配及新的临床试验等,加速医疗领域新技术、新产品从创想到应用的整个过程。
洪小文同时也表示:“截至目前,GPT-4自身还存在着一些局限性。例如,GPT-4偶尔会基于‘臆测’,对问题给出不适当的回应。此类回应不会被AI主动标注为‘臆测’,而且可能看起来很微妙、很接近用户拟想的‘真实’,因而用户很难识别。”这些“臆测”对于随意聊天或许无伤大雅,但是对于医疗行业,它看似“真实”,如果用户对它越来越信赖,其危害就有可能越来越大,甚至危及生命,准确性是医疗领域应用大模型必须解决的痛点。
《超越想象的GPT医疗》的作者给出的改进方法是将“医生-患者-AI助手”的组合转变为“医生-患者- AI助手-AI 验证者”的进阶版本,AI 验证者的任务是检查AI助手的结论及医生、患者的表现——无论扮演何种角色,始终需要让人类参与审查 GPT-4生成的所有输出。
不仅是在医疗行业,大模型在几乎每一个各行各业的落地应用,都需要“行业AI验证者”,使AI成为真正的行业。
星环科技创始人、CEO孙元浩表达了与《超越想象的GPT医疗》作者类似的观点,他认为在行业企业级市场,大语言模型要想规模化应用依然面临三重限制:“第一,训练需要半年或一年甚至更长时间;第二,无论是通用还是行业大模型,输入都有限制,这个限制取决于它的算力和工程化难度;第三,大模型有时精准度不够,会出现‘幻觉’,需要一个知识库来校正结果,同时需要一个机制来补充大模型,让它能够给出准确的答案和更实时的信息。”
大模型之争从“通用”到“行业”落地 谁来担任“行业AI验证者”?谁来校准和修正大模型的“臆测”?谁愿意提供行业数据?数据的安全谁来保障?企业又该从哪个环节切入?
华中科技大学同济医学院附属协和医院智能医学研究室主任叶哲伟表示,医疗行业一直在积极探索解决AI诊疗准确性的问题。2017年,清华大学和iFlyTek合作创建了小医生,在参考了200万个病例和40万篇论文后,其在中国执业医师资格考试中取得了456分的及格分数。2022年12月,arxiv预印版发布了PaLM参加美国执业医师执照考试(USMLE)的进展,结果显示PaLM的准确率从50%跃升至67.6%。今年5月,医联发布了医疗大语言模型——MedGPT,该公司称,这是AI首次实现从有效问诊到准确诊断的标志,实现了从疾病预防、诊断、治疗、康复的全流程智能化诊疗能力。
据介绍,医联MedGPT目前的参数规模为1000亿,预训练阶段使用了超过20亿的医学文本数据,微调训练阶段使用了800万条的高质量结构化临床诊疗数据,并投入超过100名医生参与人工反馈监督微调训练。目前医联 MedGPT已经拥有3000种疾病的首诊能力,覆盖80%以上的成年人疾病和90%以上的0~12岁的儿童疾病。
与通用大模型不同,MedGPT是一款基于Transformer架构的医疗行业大模型。目前的AIGC大模型分为三层,底层为通用大模型,比如OpenAI 的GPT、百度的文心一言、阿里的通义千问等。中层为行业大模型,如彭博的金融大模型Bloomberg GPT、医联的MedGPT,这类大模型或与通用大模型厂商合作定制,或是调用API 接口,或由大厂云厂商自研。上层为一系列应用型服务,基于通用大模型或行业大模型开发的AI工具。业内人士表示,企业用户其实并不关注所采用的是否为通用大模型,而是“数据是否安全”与“成本是否可控”,而行业大模型在这两个维度,能够更好地满足企业用户需要。
今年前几个月,通用大模型是各个公司角逐的焦点,随着时间的推移,行业大模型赛道开始变热,不仅仅是在行业里有积累的公司相继推出行业模型,包括已经发布了通用大模型的企业,也开始针对行业推出模型服务。
6月19日,腾讯云宣布面向B端客户推出MaaS(Model-as-a-service,模型即服务)服务解决方案。汤道生介绍,腾讯云MaaS是基于TI平台打造的行业精选模型商店,覆盖金融、文旅、政务、传媒、教育等 10 大行业,提供超过50个解决方案。在这些能力模型的基础上,客户只需要加入自己独有的场景数据,就可以快速生成自己的“专属模型”。除了提供基础的行业模型,数据方面,腾讯云也推出了基于腾讯云TI 平台的行业大模型精调解决方案。
腾讯云的MaaS服务里,解决了行业模型的精调以及用户担心数据安全与掌控问题。有人认为腾讯在通用大模型上相比较于百度与阿里慢了一步,但汤道生认为,通用大模型不一定是满足行业场景需求的解,企业需要的是在实际场景中真正解决了某个问题,而不是在100个场景中解决了70%~80%的问题的模型。而通用大模型的训练数据主要来自公开数据集或网络数据,对于特定行业的领域知识了解有限。腾讯更关注落地,此前马化腾在财报会上谈及大模型时表示:“腾讯并不急于把半成品拿出来展示,关键还是要把底层的算法、算力和数据扎扎实实做好,而且更关键的是场景落地。“
构建庞大的大模型生态,让用户开箱即用,正在成为AI巨头们的追逐目标。就在腾讯云推出MaaS行业模型精选店的同时,有媒体爆出OpenAI正考虑推出一个新的平台,针对定制化模型/软件的交易市场,类似应用商店的“大模型商店”。经由大模型商店,企业可以获取到各种已经过精调的AI软件以及拥有数据、能回答特定市场信息的AI,这个商店还可以让OpenAI的客户,将自己定制的AI模型出售给其他企业。
除了OpenAI,包括微软与Salesforce此前都推出了自己的模型应用商店,外界分析OpenAI此举有可能与微软形成AI生态竞争。今年5月举行的Build大会上,微软宣布采用与OpenAI 相同的开放插件(Plugin)标准,从而确保今后ChatGPT与微软一系列“智能副驾”产品服务之间的互操作性。
大模型的时代正在到来,不断降低企业用户使用大模型的门槛,不断以更低的成本、更方便的方式让用户获得AI赋能,各类厂商在大模型落地之路上正 “八仙过海”寻求解。
而作为用户,汤道生认为,企业用户拥抱AI带来的变革需要关注四个维度,第一,聚焦企业自身业务,挑选具体场景,让AI成为服务的增量;第二,确保训练数据质量,梳理出测试用例,建立上线评估流程;第三,确保服务合规,同时关注数据的产权与隐私;第四,使用云厂商工具,搭建一体化的模型服务,这样效率比较高,节约训练、运维的成本和时间。