在AI期间,如何为中国经济估值7.5万亿个数据行业
日期:2025-05-19 09:16 浏览:

资料来源:钛媒体
最近,美国阻止中国访问数据引起关注的消息。
5月18日,美国国立卫生研究院(NIH)清楚地禁止中国访问数据库和相关数据,例如人类基因组,疾病研究。同时,美国的许多公共数据库,例如SEER,TCGA,GTEX和GDC在美国都阻止了进入中国的机会。
该提案与美国政府在2024年2月的14117号行政命令“防止从国家获取美国数据”的第14117号行政命令有关”,以防止获得美国私人数据,例如中国。
美国的NIH步骤允许中国公司和研究机构体验全球数据流面临的局限性,并使我们明确了数据源在中国和技术中国的发展以及创新发展方面的基本意义。
国家数据管理局最近发布了“行动PLAn在2025年第一次为当地数据管理部门建设数字中国,要求到2025年底,数字中国的构建将成为重要的发展,主要数字账户行业的增加价值超过GDP,建筑进步的10%以上,构建电力量表将超过300个国家的范围,以超过300个国家的投资,以使国家的投资在国家 /地区的投资中增加,国民数据局的投资使国家的投资增加了。主要的利益和长期数据基础设施项目;
实际上,作为世界上第一个将数据纳入劳动因素的国家,中国首先在数据行业建立了完整的链条。
数据显示2024年中国数据的年度生产达到41.06 ZB,增长了25%。迄今为止,中国数据字段中有超过190,000家相关公司,数据行业的规模已超过2万亿元。根据20%以上的年增长率,到2030年,中国数据行业的规模将达到75万亿元。
在5月17日举行的2025年数据安全开发会议上,该党党党局长刘·李港(Liu Liehong)和国家数据管理局主管刘·李港(Di Liehong)据说中国是丰富的数据资源,完整的工业系统,广泛的应用程序场景和大型市场空间。因此,有必要维持数据安全,保护个人信息和商业秘密,促进良好的流通和数据使用,并增强实际经济的能力。目前,中国正计划开发一种数据基础架构系统,该系统是连接,垂直连接和协调的,并实际上建立了NA的基本结构到2029年到2029年。
在会议上,信息(688023.sh)的CTO Liu Bo告诉Titanium Media AGI,数据安全对于开发AI技术至关重要。准确的数据可以应用于许多垂直模型,否则它将产生“幻觉”。尤其是当企业构建垂直AI代理时,他们需要为应用程序使用大量私有化数据。
Liu Bo强调,如果它要开发业务软件,数字变革,大数据或公司竞争和变更功能,AI实际上为中国带来了新的机会来解决实际的业务问题。在AI期间,所有应用程序都值得再次执行,所有行业都将带来新的工业升级。
AI数据需要保护和使用该值
目前,数据已经超过了传统的生产因素,并已成为AI技术突破和工业变革的主要驱动力。它也是建立n的新主要劳动因素G建造数字中国并加速数字经济的发展。高质量的数据集不仅是AI模型性能的跳跃基础,而且是从技术研发到商业实施的整个工业链的重塑。
“在数字经济期间,数据就像'工业'石油一样,是每项业务安全和开发的必要方法。”国家发展与改革委员会价格监控价格副主任王江表示,近年来,中国的数据因素因素市场已经进入了快速线,但与此同时,它也面临着诸如不足的协调工作,不充分的市场发展和不良循环数据等挑战。
Elemen已经被报告为数据是指在制造商品或服务过程中投入的数据资源并获得福利。这些是基本信息,数据集根据特定生产要求收集,遵守和处理的ND数据产品。
为了确保数据元素的大规模流量,AI产业链加速了大型数据集的构建,主要包括主要链接,例如数据收集,数据清洁,数据注释和质量审查。每个链接都必须根据大规模,强大多样性和强大的行业特征的特征来进行有针对性的技术研发和适应。
北京大学的计算机教授Huang Tiejun说,文本数据包括文献,书籍,纸张,研究报告和其他数据,其中大多数用于大型模型技术。将来,仍然需要更多不需要文本的数据,例如图像和视频,这已成为大型模型研究的重要来源之一。
因此,在关注数据安全保护的同时,我们应该注意DAT的数量A,这将有助于促进中国AI技术技能的持续提高。
根据“中国电子信息行业发展研究所发布的高质量数据开发报告,2024年,组成或应用AI的企业的数量同比增长了36%;当地公共数据数据的数量使市政当局的市政平台和全国范围内的市政平台增加了7.5%,同时增加了7.5%的开放率,并增加了7.5%的份额,并增加了27%的数据。时间,使用大型AI模型的数据技术公司的数量去年增加了57.21%,数据应用公司增加了37.14%。
该报告指出,国家和地方政府发布的高质量数据集目前在生态和环境污染领域的应用中富裕。工业制造,BI等行业中的数据集数量Omedicine,农业和政府数据服务处于中等水平;能源光伏,金融法,运输和物流,教育和气象遥感等行业中的数据集数量进行了分类,该行业继续促进数据集的构建和开放。
CIDI研究所副主任Liu Wenqiang表示,Thechina的AI模型参数已达到了公路的数量,并促进了全国范围内的7个数据标签的7个基础,并建立了医疗保健。335。335高质量的数据集在行业,教育等领域等高质量的数据集,该型号的数量是1.7 trillion Trillion TBS(Trillion TBS)。被标记的中国产业超过80亿元人民币。
Liu Wenqiang指出,从当前的调查中,在集成的数据和股票方面,数据库存小而低的输出,数据集的影响需要提高ove。同时,就数据和质量供应而言,数据质量不均匀,并且缺乏高价值数据指南。此外,数据挖掘和使用中存在算法偏见,NA加剧了数据丢失。迫切需要开发高质量的数据并挖掘数据元素的量。
现在,随着AI时期的出现,大数据变得重要。数据应受到保护和使用。如何使用AI数据来产生实际价值并帮助公司实现降低成本和提高效率是国内从业人员的一个假定答案问题。
阿里巴巴云智能集团副总裁少年说,今天的数据收集,数据清洁,数据注释,数据挖掘,过程培训和自主驾驶模型的审查正在从传统的Manu -Charuing -Chinu -Manu -Manu -Notnotation和Manu -Manu -Manu -Manu -Manu -Manu -Manu -Manu -Manu -Manu -Manu -Manu -Manu -Manu -4个月到7个月至7个月至7个月至7个月到7个月至7个月至7个月,增强了Manyy(Manyy(Manyy),Many Yearny(Mmany)。
小米认为大型AI modEL是数据元素发布该值的最短路径。在大型大型模型中进行了工业数据培训后,开发业务数据的各种方法已大大提高,这将减轻应用程序施工过程的效率提高了70%,业务速度提高了50%,并且数据审核周期缩短了60%。
“我们可以看到,基于人类规则的代码正在模型的大规模模型代码;物理世界的法律,建模算法,然后计划算法代码和代码,从而形成物理世界,数字世界,大型模型的智能世界。”小米强调,现在,数据的主体已经从为人们服务转向了人工智能交付。 AI时代来了,人类计算机接触的基本逻辑发生了巨大变化。企业需要重新定义人类计算机联系经验,重新定义流量进入并重新识别客户需求,市场,流程和新业务系统。
对于AI模型,数据大小继续增长。
统计数据表明,在2023年,中国的数据输出约占全球总数据输出的23%,这是全球首先排名的。据估计,中国数据的总产出将在2025年达到48.6 ZB,这一数字约为全球1/3。同时,2025年,全球数据交易的规模预计将增长到1445亿美元,到2030年,预计将达到3011亿美元(约合2.2亿元人民币)。
中国科学院的学者徐陶在关于“数据赋予生命和健康行业的能力”的演讲中,教导说,生活和良好的健康数据是一种重要的战略资源,是复杂而敏感的,因此有必要建立整个周期安全系统。他指出,通过高级技术,例如区块链加密和隐私计算,以下生物SAM循环可以实现PLE数据,预计将将研发成本降低30%。
美国国家工程学院学者Minasi Shen Changxiang建议解决方案“可靠的计算3.0”。他强调,在数字经济期间,必须重建安全防御线,而由我国家独立开发的可信赖的计算链已经包含了芯片,系统和应用的各个方面。通过开发主动的免疫保护系统,它可以有效防止新型的网络攻击。
数据量表转向-Srocket,AI是下半年的智能机构
“ DeepSeek始于政府服务公司的新机会。您可以在不购买计算强度的情况下使用AI模型。”钛媒体AGI的一家内部行业说,采省有许多情况,他们目前正在使用基于DeepSeek和私有化数据的专用模型。
例如,中国AI模型的开源可以准确识别疾病。中医省省医院目前正在许多部门的医疗状况中尝试Medi Assidantkal AI,例如妇产科,儿科和血液学。
信息信息主席Fan Yuan告诉会议,代理和动态数据的整合是不可避免的。我们即将进入“代理影响决策”的环境,因为AI比人更好地理解数据,AI比人更好地了解业务,并且AI比人了解行为。
“在传统的数据安全阶段,我们仍然存在许多尚未解决的问题。现在,当我们面对大规模,高通量,快速速度和更开放的流动过程时,我们无法避免我们的动态安全,从静态保护到动态保护,从边境安全到内源性融合安全性,从封闭的环境保护到开放环境,到开放环境,” Fan Yuan说。
粉丝元强调AI的后半部分应该是代理,而代理是与大型模型在场景中的应用不可避免的进化。因此,AI代理人继续从“条件自治”到“完全自治”,使AI代理人成为安全工作者的合作伙伴,独立学习并深入了解,以定义所有安全人员的问题,参与复杂的决策,并为工作提供创造性的解决方案。
Liu Bo补充说,AI开发不仅仅是一个“大型模型”,但是需要混合技术和工具,例如代理和MCP。 Thelarge模型仅使用户能够思考和结合信息。它不能完全替换软件。相反,需要通过代理,MCP等向客户提供它,以便企业可以在不同情况下调用相应的工具,从而大大提高企业的工作效率。
2023年早些时候,Anheng信息启动了“ Hengwang ・安全垂直域模型”,并成功地将其应用于许多情况。今年5月初,Hengnao升级了3.0版,该版本成为中国AI智能的第一个安全机构。据报道,依靠汉旺(Anheng)的信息已经完成了500多家共同创建代理,涵盖了数十种场景,并迅速将功能纳入了现有产品。
在谈到具体的intelife安全时,刘博说,物理世界的安全非常重要。有必要确保无人机,智能机器人和其他产品不会受到攻击,这在网络安全中更加困难。当受到攻击和控制时,设备将失去控制。因此,我们需要为智能操作系统,嵌入式系统及其自己的软件提供数据安全系统安全系统和网络安全保护的保证。
在2025年的数据安全开发会议中,来自25个的代表包括温州,重庆,武汉,西安,宁波,青岛在内的城市签署了“一百个城市行动”城市的数据元素合作联盟,并签署了30多家签署现场合同的数据公司,以整合现场生态学数据的新生态。六个平台和实验室的级别级别,包括数字符合安全性和Wenzhou Ouyue Digital A实验室。
但是,中国仍然面临着诸如小型数据库存,低输出,质量低的数据集,缺乏基本高价值数据指南以及低数据使用效率等问题。有必要在数据资源控制工作中做好工作,确保数据资源的可靠性和完整性,增强数据和安全隐私保证并促进数据安全评估的构建。
刘·莉汉(Liu Liehong)为他的演讲带来了三种意见:首先,继续促进基本数据系统的改革和变化,并加强了全面的经验数据元素的细胞区域。第二个是UPG加速改善数据流通和使用基础架构,依靠技术试点项目,例如受信任的数据空间,并探索可复制,易于促进和可持续的模型。第三个是努力地促进以市场为中心的技能,并基于数据元素的价值,并将大量数据(保护)资源的好处转变为新的经济发展驱动力。为了探索释放数据值的途径,国家数据管理局支持在包括千江在内的10个地方的数据元素的综合实验区域构建。
Liu Liehong在上一届数字中国建设峰会上强调,为了加快数字中国的构建,我们必须抓住AI的发展带来的前所未有的机会,促进对数据元素的面向Marchat的改革以及“人工智能 +”的行动,以与彼此之间的共振行动,继续促进高质量数据的供应,加速数据元素与AI,科学和技术创新,工业发展的发展以及工业发展的发展以及工业发展的发展,发展发展和发展发展,发展发展,发展发展以及高质量的行业数据集合,促进数据行业的高质量发展以及为现代AI技术和工业技术提供固体数据基础。
(本文首次发表在钛媒体应用中,带有-set | lin zhijia)
金融的官方帐户
24小时广播滚动滚动最新的财务和视频信息,并扫描QR码以供更多粉丝遵循(Sinafinance)