(资料图片)
投资要点
AI 投资除了算力和算法,更要重视数据。数据、算法和算力是大模型最重要的三要素。人工智能的根基是训练,只有通过大量的训练,神经网络才能总结正确的规律进行应用。训练的基础除了算力和算法,更需要海量的优质数据。只有掌握核心行业数据,才能训练出适用于行业应用的垂直行业大模型。近期,360 董事长周鸿祎谈论AI 时表示:“算力不是最关键的问题,场景和数据是关键。有知识量的数据,中文语料占了不到5%,大量知识在外文期刊里面。想要给具体行业赋能,让AI 成为某一个领域的专家,就必须使用对应领域的专业数据来训练。未来国内各个大厂都会推自己的大模型,微软、谷歌以及未来国内大厂的模型相当于一个通用模型,大而不精。想要给具体行业赋能,成为某一个领域的专家,就必须使用对应领域的专业数据来训练”。
各个大模型厂商正逐步推出垂直行业应用,政策也在加速推进行业数字化。
截至2022 年11 月,文心已累计发布11 个行业大模型,涵盖电力、燃气、金融、航天、传媒、城市、影视、制造、社科等领域。3 月30 日,彭博社发布的研究报告显示,彭博构建了迄今为止最大的特定领域数据集,并训练了专门用于金融领域的LLM,开发了拥有500 亿参数的语言模型——BloombergGPT。该模型依托彭博社的大量金融数据源,构建了一个3630 亿个标签的数据集,支持金融行业内的各类任务,在执行金融任务上的表现远超过现有模型,在通用场景上的表现与现有模型也能一较高下。
垂直场景数据、数据安全、AI 大模型自主可控需求背景下,AI 投资更要重视“数据要素+国资云”。训练垂直行业的大模型,需要使用专业的海量行业数据。结合近期据发改委官方批露:我国政府数据资源占全国数据资源的比重超过3/4,但开放规模不足美国的10%。个人和企业可以利用的规模更是不及美国的7%。以“国资云+垂直领域模型”方式,可以确保敏感重点行业原始数据不出域,加速推动行业的智能化转型升级。而为了保障重点行业数据资源的安全,未来国内大模型的数据存储和运算,势必会更大程度使用自主可控的国家队算力资源。与此同时,美国加大AI 相关产业链制的裁力度背景下,大模型“国家级”平台智源研究院,与中国电子云、中国移动九天人工智能团队等两大央企集团,合作加速推进国产化大模型发展,加速自主可控国产化AI 大模型发展进程,国内算力自主可控需求迫切。因此,未来在垂直场景数据、数据安全、AI 大模型自主可控需求背景下,我们认为AI 投资下一步要重视“数据要素+国资云”。
总结来看,具备运营、治理政务数据、及重点行业、关键垂直领域数据的”
数据要素运营商“、以及央国企背景的自主可控国资云厂商,有望迎来价值重估。重点推荐:深桑达A(全栈式自主可控中国电子云、背靠CEC 数据要素运营商)、中国电信、中国移动、中国联通等AI 算力国家核心力量,以及云计算基础设施厂商(润泽科技等,关注光环新网、奥飞数据等)。
风险提示:政策推进不及预期,技术研发不及预期,项目落地不及预期。
Copyright © 2015-2022 全球家电网版权所有 备案号:豫ICP备20009784号-11 联系邮箱:85 18 07 48 3@qq.com