Update 第3章 中国开源项目发展现状.md

上级 4cf0a49f
...@@ -252,17 +252,15 @@ GitHub作为全球最大的开源社区,其项目数据极具参考价值。 ...@@ -252,17 +252,15 @@ GitHub作为全球最大的开源社区,其项目数据极具参考价值。
据艾瑞咨询分析,2021年人工智能核心产业规模预计达到1998亿元规模,相应规模将于2026年超过6000亿元,2021-2026年的复合年均增长率为24.8%,人工智能产业正从发展期向成熟期过渡,除AI芯片外的细分技术赛道产业已跨过高速增长期,步入了稳步增长阶段。 据艾瑞咨询分析,2021年人工智能核心产业规模预计达到1998亿元规模,相应规模将于2026年超过6000亿元,2021-2026年的复合年均增长率为24.8%,人工智能产业正从发展期向成熟期过渡,除AI芯片外的细分技术赛道产业已跨过高速增长期,步入了稳步增长阶段。
在产业增长期,人工智能领域的企业与研究人员正通过结合开源,促使各环节提升经济生产活动效能。如今,在AI模型规模更加庞大、算法架构更为复杂、所需训练数据更为巨大和繁杂的情况下,开源可以一定程度上降低研发成本,提高研发效率。通过将已有研发成果汇集于开源代码库中,帮助更多开发者进行技术研发工作,已是人工智能领域的惯例。2022年,在推荐算法、强化学习、机器人等领域,更多人工智能代码库开源,形成了垂直、活跃的交流社区,助力产业发展。 在产业增长期,人工智能领域的企业与研究人员正通过结合开源,促使各环节提升经济生产活动效能。如今,在AI模型规模更加庞大、算法架构更为复杂、所需训练数据更为巨大和繁杂的情况下,开源可以在一定程度上降低研发成本,提高研发效率。通过将已有研发成果汇集于开源代码库中,帮助更多开发者进行技术研发工作的开展,已是人工智能领域的惯例。2022年,在推荐算法、强化学习、机器人、可信人工智能、人工智能可解释性等领域,更多人工智能代码库开源,形成了垂直、活跃的交流社区,助力产业发展。
从研究方向看,人工智能领域的研究人员热爱开源,且热衷于基础性的研究内容,如深度学习开源框架、目标检测开源框架等。此外,图像分类、语义理解、图像分割、文字识别、语音合成等实用性场景同样拥有极高的关注度 从研究对象看,从早期的文本、图像、音频和视频,渐渐转向3D数据模态。带来的影响是针对数字人的研究得到了空前关注。基于3D的数字人、元宇宙等内容已然成为各大科技公司争相角逐的热点内容。知识图谱是新兴的技术领域,可以广泛应用于可用图表示的各业务场景中。其底层使用的图数据库也在开源社区如火如荼的发展,包括Nebula, Neo4J, JanusGraph等在行业内逐步开始使用
从研究对象看,从早期的文本、图像、音频和视频,渐渐转向3D数据模态。带来的影响是针对数字人的研究得到了空前关注。基于3D的数字人、元宇宙等内容已然成为各大科技公司争相角逐的热点内容。 从产业角度看,人工智能开源项目从原本的小型应用场景(如目标检测、文字识别等)逐渐向大而全的生态系统转变,开始广泛应用于各行业和产业。
从产业角度看,人工智能开源项目从原本的小型应用场景(如目标检测、文字识别等),逐渐向大而全的生态系统转变。
从开源单位看,企业的研究院相比高校的实验室,产出了更多有影响力的项目,国内人工智能开源项目所属单位影响力较大的如百度、京东、阿里巴巴、腾讯、字节跳动、商汤、旷视等,可见各大企业近年来在不断加大开源社区生态建设方面的投入。 从开源单位看,企业的研究院相比高校的实验室,产出了更多有影响力的项目,国内人工智能开源项目所属单位影响力较大的如百度、京东、阿里巴巴、腾讯、字节跳动、商汤、旷视等,可见各大企业近年来在不断加大开源社区生态建设方面的投入。
总体来看,国内在人工智能领域的研究日益广泛,相应的开源项目也层出不穷(见表11),许多有影响力的工作均得到了来人工智能各地开发金会的贡献。 总体来看,国内在人工智能领域的研究日益广泛,相应的开源项目也层出不穷(见表11),许多有影响力的工作均得到了来人工智能各地开发的贡献。
|项目名称| 项目地址 |项目简介| |项目名称| 项目地址 |项目简介|
|-|-|-| |-|-|-|
...@@ -282,6 +280,16 @@ GitHub作为全球最大的开源社区,其项目数据极具参考价值。 ...@@ -282,6 +280,16 @@ GitHub作为全球最大的开源社区,其项目数据极具参考价值。
![在这里插入图片描述](https://img-blog.csdnimg.cn/c7ce6b1d92744888a65adf9fdc8c2e56.png)<br/>*图23 人工智能和数据基金会交互全景图(LF AI & Data Foundation Interactive Landscape)* ![在这里插入图片描述](https://img-blog.csdnimg.cn/c7ce6b1d92744888a65adf9fdc8c2e56.png)<br/>*图23 人工智能和数据基金会交互全景图(LF AI & Data Foundation Interactive Landscape)*
关于人工智能发展方向,COPU名誉主席陆首群的博客《评人工智能如何走向新阶段》触发了大量“国内外AI跟帖留言”。陆首群总结到,人工智能的出路有四条(包括研发其基础理论):①打破机器学习的黑盒子研发可解释的人工智能; ②基于异步脉冲神经网络的神经拟态计算系统; ③从知识工程出发,依托大规模语义网络(知识图谱)的支持,破解认知智能解决方案; ④脑机接口的理论和实践。目前①已有所突破,②已见亮点,③还差最后一公里,④国内外已有几十例试点。
当下,打破机器学习黑盒子研发可解释的人工智能已成为一股热潮: IBM为打破机器学习黑盒子研发可解释的人工智能,在开源社区Linux Foundation(简称LF)贡献了可信AI的关键技术,包括人工智能公平360工具箱(AIF360);对抗性鲁棒性360工具箱(ART);人工智能可解释360工具箱(AIX360)。LF AI建立了《可信人工智能委员会》,制定了AI的基本原则,即公平性、鲁棒性、可再现性、透明性、可解释性、隐私、安全和问责。
非常关注打破机器学习黑盒子研发可解释的人工智能,其邀请IBM副总裁Todd Moore在COPU 2020和2021峰会做了两次题为基于开源的可信人工智能和人工智能可解释性的主题演讲。随后,IBM写了两篇关于基于开源的可信任的人工智能和人工智能可解释性的方法和案例(分析了三个可解释性人工智能案例:银行信贷业务、个人医疗开支、皮肤镜检查应用)。
除IBM外,马格德堡大学人工智能实验室Sebastian Stober团队也在研发可解释的人工智能技术,其研究项目的编号为为CogxAI。
从研究方向看,上述四条人工智能的出路将是人工智能的主流方向。也将是人工智能开源相关领域的发展方向。
### 3.2.3 开源与大数据 ### 3.2.3 开源与大数据
大数据是当今最热门的技术之一,采用分布式架构的设计思路,通过并行计算的方式来提升大规模数据分析与处理效率,同时具备高扩展能力。经过近20年的发展,大数据的技术栈逐渐成熟。国内的大数据公司可以分为两类:一类是以百度、腾讯、阿里巴巴、华为、浪潮和中兴为代表的国内领军企业,它们通过构建数据采集、数据存储、数据分析、数据安全和数据可视化的平台,具有获取和应用大数据的能力;另一类是大数据平台技术公司,它们专注于大数据技术本身的创新,针对市场需求,基于大数据工具为客户实现大数据应用解决方案。 大数据是当今最热门的技术之一,采用分布式架构的设计思路,通过并行计算的方式来提升大规模数据分析与处理效率,同时具备高扩展能力。经过近20年的发展,大数据的技术栈逐渐成熟。国内的大数据公司可以分为两类:一类是以百度、腾讯、阿里巴巴、华为、浪潮和中兴为代表的国内领军企业,它们通过构建数据采集、数据存储、数据分析、数据安全和数据可视化的平台,具有获取和应用大数据的能力;另一类是大数据平台技术公司,它们专注于大数据技术本身的创新,针对市场需求,基于大数据工具为客户实现大数据应用解决方案。
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册