大模型结果“真假难辨”如何解决?对话天壤创始人、CEO薛贵荣:用这个技术丨WAIC 2023
2023-07-11 12:28:37 来源:每日经济新闻
(相关资料图)
7月7日下午,天壤创始人、CEO薛贵荣接受了《每日经济新闻》记者的专访。在2023世界人工智能大会上,该公司发布了一种大模型产品生态——“天壤小白”。其中包含最高1860亿参数的通用大语言模型、语义搜索引擎和开发平台。
目前,国内已是“百模混战”,天壤推出的大模型生态有何别致之处呢?薛贵荣首先向记者介绍了大模型存在的四大挑战,即大模型产生真假难辨的“幻觉”,所谓“一本正经的胡说八道”;政企私有数据的保密性要求,不能对外公开;缺少可靠的企业级中文大模型;大模型存在封闭性,无法自动更新信息。
关于天壤如何解决大模型“一本正经的胡说八道”,薛贵荣表示:“用‘提示词’去控制大模型,大模型还是会胡说八道。后来,有人尝试输入一些简单的上下文,以及对大模型进行fine-tune,但这个也不够。我们为了解决‘幻觉’问题,做了一个语义搜索引擎。先把需要的所有文档,放到语义引擎里面,比如法律书、知识库或者企业内部各种数据。该引擎使用了一个核心技术,即embedding。”
薛贵荣进一步解释:“生成式模型,最大的特点就是结果的不确定性。”那么,如何提高生成式模型的准确性呢?
薛贵荣认为:“现在给你100个字,你的答案就在这100个字里面总结。”那么是否为了提高准确性,限定生成(内容)的范围?薛贵荣回答称:“你只能用这里面的内容,做一次理解上的修饰。”
据其介绍,上述限制是放在推理端。简而言之,就是训练好大模型,为了得出一个精确值,在推理端限定一个范围。
薛贵荣介绍称,目前公司主要有三个团队,一个专门训练大模型;第二个是Fine-tune,做行业专用模型;第三个是做应用提示。
对于天壤小白大模型通过什么算力训练的?薛贵荣表示:“我们(基础)大模型的算力是租的,比如租用苏州超算(的算力),上海像商汤(的算力)我们也租。它们(商汤)有1万多张A100。另外,我们家里也有大概300张卡,以3090为主。”
封面图片来源:视觉中国
最近更新
- 大模型结果“真假难辨”如何解决?对话天壤2023-07-11
- 合肥诞生“可计算的数字地球”2023-07-11
- 产业 | 从家庭作坊到智慧厂房 看凤凰岭2023-07-11
- 福特勇猛者F力150(猛禽)迈巴特版七座豪华2023-07-11
- 海水养殖行业发展分析:我国海水养殖发展的2023-07-11
- 中国西式火腿行业市场全景调研与发展前景预2023-07-11
- 扩容提质释放电商消费潜力 电商平台行业市2023-07-11
- 从零售量角度分析 中国除螨仪零售量也呈现2023-07-11
- 中国烟草生产行业发展前景及投资风险预测分2023-07-11
- 我国首次实现二氧化碳长距离密相管输2023-07-11
- 紫色康乃馨代表什么2023-07-11
- 动力有所提升!新款名爵家轿更新 8万预算2023-07-11
- 舌华录·清语第九·282023-07-11
- 恒生科技指数涨超2%2023-07-11
- 重大工程助力高质量发展2023-07-11
- 国家药监局:我国成为全球第二大医疗器械市2023-07-11
- 自媒体视频中撕律师函获5万多赞,律所:涉2023-07-11
- 财务核算不规范、信息披露不准确、内部控制2023-07-11
- 一手出口,一手新能源!车市“半年考”交卷2023-07-11
- 齐家网总裁邱振毅:中小家装企业运营模式还2023-07-11
- 电池回收企业吉锐科技拟IPO 保荐机构相关2023-07-11
- 性情中人项乐宏 是160万粉丝主播,也是乐2023-07-11
- 物联网板块走强 物联网50ETF涨超2%2023-07-11
- 杰尼斯性丑闻余震,木村拓哉资生堂广告代言2023-07-11
- 多家上市公司因在互动平台“蹭热点”收到关2023-07-11
- 正在直播 | 办实事解民忧!新民晚报夏令2023-07-11
- 50多万博士生分布地图:近8成在省会 我国高2023-07-11
- 2023烟草生产行业发展分析 烟草生产行业发2023-07-11
- 加多宝回应被判赔广药集团3.17亿元 资本巨2023-07-11
- 订单激增 冰生意非常火爆 有工厂日产50吨2023-07-11