Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
开源软件推进联盟
《2022中国开源发展蓝皮书》意见征集
提交
abd79521
《
《2022中国开源发展蓝皮书》意见征集
项目概览
开源软件推进联盟
/
《2022中国开源发展蓝皮书》意见征集
通知
75
Star
16
Fork
12
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
1
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
《
《2022中国开源发展蓝皮书》意见征集
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
1
Issue
1
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
提交
abd79521
编写于
5月 24, 2022
作者:
《新程序员》编辑部
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
更新《2022中国开源发展蓝皮书》非最终版/第3章 中国开源项目发展现状.md
上级
c299340a
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
103 addition
and
0 deletion
+103
-0
《2022中国开源发展蓝皮书》非最终版/第3章 中国开源项目发展现状.md
《2022中国开源发展蓝皮书》非最终版/第3章 中国开源项目发展现状.md
+103
-0
未找到文件。
《2022中国开源发展蓝皮书》非最终版/第3章 中国开源项目发展现状.md
浏览文件 @
abd79521
# 第三章 中国开源项目发展现状
## 3.1 GitHub中国项目活跃度及趋势
据全球GitHub事件日志、活跃仓库、活跃开发者五年趋势图显示,GitHub仓库与开发者活跃数量稳步上涨,事件日志总量在2021年突破了10亿条。通过统计全域GitHub 事件日志,可观测到近5年全球开源的总体活跃情况和活跃仓库数量都在明显上升。特别是COVID-19疫情暴发已来,尽管新冠疫情影响了人们的工作生活,但是没有阻止开源事业的发展。与此同时,中国开源发展也进入平稳增长期,随着2021年国家对开源的支持政策出台以及开放原子开源基金会的成立,促使各大企业相继拥抱开源、大力投入、并涌现出一批以开源为主的初创企业。可以预见,在不久的将来,中国开源的发展还将进入新的快速增长期。
![](
)**
![](
)**
为了更好地展现中国企业在全球范围内的开源贡献水平,本节通过对比美国与中国活跃度排名前十的开源贡献企业、美国与中国开源影响力排名前十的企业进行分析。
美国的大型互联网企业在开源活跃度与影响力方面持续领先,微软由于使用GitHub作为大部分团队的日常开发平台,故项目数量较大,总活跃度第一,Google次之,而在项目平均活跃度方面,Google依然是世界上平均活跃度最高的企业。在中国企业的开源活跃度排名中,阿里巴巴的项目数量和总活跃度均为榜首,但整体项目体量以及活跃度总量距离美国Google等大企业还有一定的差距。不过,中国的开源初创企业和项目则表现抢眼,根据项目平均活跃度可见如 PingCAP、百度、青云、悦数科技(vesoft)都脱颖而出。
![](
)**
![](
)**
从总体活跃度指标来看,虽然在开源项目的体量方面,中国较美国有一定落差,但在项目平均活跃度方面则水平相当,因此,中国需要继续大力孵化、培育优秀开源项目。
企业的开源影响力指标更关注开发者生态,对比美国与中国的企业在影响力指标可见,美国的开源项目数量更多,二者在项目平均影响力的表现则相当。在中国企业中,有赞的开源项目影响力最高,从一众企业中脱颖而出,这得益于其主要的开源项目vant良好的开发者生态。
![](
)**
![](
)**
此外,从中国企业近5年的开源发展趋势,包括活跃度趋势与影响力趋势来看,阿里巴巴、百度、蚂蚁集团长期名列前茅。其中,阿里巴巴的开源活跃度与影响力长期排名榜首,百度近几年对开源的投入与贡献显著增加。值得一提的是初创企业PingCAP,其开源活跃度与影响力一直稳居第四的位置。
![](
)**
![](
)**
同样的,根据开源项目活跃度和影响力,相较GitHub中全球开源项目和中国开源项目的Top 20,可见从单个项目而言,中国主导的开源项目的活跃度和影响力距离全球顶级开源项目的活跃度与影响力还有一定差距,特别是在影响力方面,需要国内企业最大限度地融入全球开源生态中发展中国开源项目。
![](
)**
![](
)**
![](
)**
![](
)**
## 3.2 中国重点领域开源项目发展现状
在国家政策、资本力量、商业组织与科研机构等多方利好形势下,人工智能、大数据、云计算、工业互联网、区块链等技术快速发展,并被广泛应用。与此同时,各技术领域受开源文化影响,秉承开源、开放的态度建设多层次人才培养体系、构筑产业集群优势、加快推动应用发展、促进产业融合创新。如今,人工智能、大数据、云计算、工业互联网、区块链等技术领域结合开源,已经呈现出技术与产业协同发展的新局面。
### 3.2.1 开源与基础设施
#### 操作系统
当前国内基于Linux发行版而构建的操作系统层出不穷,加速了国产操作系统的发展,国内开发者对操作系统的关注度也日趋增长。由于自研操作系统的投入巨大且研发、维护、更新周期长,能形成一定生态规模的操作系统在全球局指可数,能够打破已有市场的新型操作系统更少。因此,多年来研发操作系统及通过自研操作系统盈利的国内企业极少。
近年来随着开源声势在国内日渐浩大,操作系统领域也在拥抱开源的情况下,诞生了一批国产开源操作系统,如华为主导的OpenEuler服务器领域操作系统和OpenHarmony移动终端/物联网操作系统,以及阿里巴巴主导的OpenAnolis服务器操作系统、腾讯主要的OpenCloudOS服务器操作系统。众多操作系统领域的利益相关方也形成了一种共识:开源有助于开放创新,源代码公开可供修改学习;开源还能帮助企业塑造品牌影响力。
目前的操作系统的边界已经被大大地扩展了。在产业界,操作系统在努力向国际先进水平靠近。如:
*
国内的 OpenEuler 操作系统、龙蜥操作系统、麒麟操作系统、统信操作系统等,与国外的 Ubuntu 操作系统、RedHat 操作系统、SUSE 操作系统类似,都是基于 Linux 操作系统内核的多种软件集合形成的 Linux 发行版;
*
运行在手机上的 OpenHarmony 操作系统与 Google 的 Android 操作系统类似,都是基于 Linux 操作系统内核,提供适合触摸交互的图形交互软件框架和移动终端共性服务的移动终端类操作系统;
*
运行在嵌入式设备上的 OpenHarmony 操作系统、RT-Thread、SylixOS 等则是属于实时操作系统(RTOS)范围,除了在传统工业控制上继续发展之外,还在互联网、物联网、分布式协同领域等快速突破,形成了开发环境、分布式协同等更广泛的系统级支持;
*
在目前火热的自动驾驶领域,不少国内新造车企业(如理想、蔚来、小鹏等),与国外的特斯拉等在多方位进行竞争,都开展了面向新型电子驾驶、自动驾驶的操作系统研发,形成了新的操作系统产业热点。
#### 芯片
相比价值已达数百亿美元的开源软件生态,芯片虽已成为支撑各行各业的基石,但开源芯片仍处于起步阶段。在处理器芯片领域,基于开源指令集 RISC-Ⅴ的开源芯片生态正在快速崛起,为开源芯片生态的创新降低了技术门槛,为包括中国在内的广大发展中国家突破中央处理器(CPU)芯片领域的技术壁垒和市场壁垒带来新机遇。虽然 RISC-Ⅴ 在中国发展得如火如荼,但基于 RISC-Ⅴ 构建开源芯片生态仍面临若干挑战,开源处理器(L2 级)仅仅是一个必要条件,还需要软件、应用、人才、资金等多种关键要素。中国作为制造业大国,仍需大量进口芯片,甚至面临“卡脖子”困境,面临极大的供应链风险。近期全球陆续出现的“缺芯潮”,导致汽车制造等重要工业领域停工停产,使包括中国在内的世界各国都蒙受了不可估量的经济损失。
#### 数据库
早在20世纪50年代,互联网技术(ARPANET)的先驱们就十分推崇同行评审和开放反馈,用户组通过共享源代码,相互扶持、激发创新,到20世纪90年代互联网诞生时,协作、开放、创新的价值观就已植根于互联网的内核之中。
在数据库技术领域,始于70年代的Ingres项目,代码就使用BSD许可证分发,在其基础之上,以各种形式演绎出包括 Sybase、Microsoft SQL Server、NonStop SQL、Informix 、PostgreSQL等著名产品,成为数据库历史上最成功的项目之一。
本质上,开源软件和闭源软件都只是一种软件研发和消费模式,在不同时期和场景有着各自独特的竞争力和优势体现。时至今日,开源软件依托其社区开发模式,能更快的实现产品迭代和用户触达,进而形成免费软件加付费服务的业务模式,并进一步通过云获得价值回报,MongoDB等数据库都在探索这一模式。此外,从市场竞争战略来看,软件开源已经成为后来者扩大其市场影响力、追赶头部企业的重要手段。
国内开源数据库的发展,经历了借鉴、发展、创新的全历程,早期国产数据库的探索者人大金仓就是以PostgreSQL为基础,而NewSQL的代表产品TiDB则是源自2013年Google Spanner/F1论文的技术实现,更多的NoSQL数据库也相继开源,如悦数科技在2019年开源了它的原生图数据库Nebula Graph的alpha版。自2019年以来,国内开源数据库领域快速发展,大事件频现,推动国内开源产业的蓬勃兴盛。
据 DB-Engines 的数据显示,自2021年1月,开源数据库的流行度首次超越商业数据库,并持续领先。全球 383 款数据库中,开源数据库占据 51.7%,排名前十的数据库中,开源数据库占据六席。据墨天轮的中国数据库流行度排行榜,198个数据库产品中包含13个开源的数据库产品,而榜单的前十名就有5个开源产品。从数据库开源项目的现状来看,全球最受欢迎的两种开源数据库MySQL 与 PostgreSQL是一系列数据库产品衍生的基础,中国数据库流行度排行榜中,源自MySQL和PostgreSQL的数据库数量分别为12和18。在今天的数据库领域,开源已经成为主要的趋势和潮流。
![](
)**
![](
)**
### 3.2.2 开源与人工智能
据艾瑞咨询分析,2021年人工智能核心产业规模预计达到1998亿元规模,相应规模将于2026年超过6000亿元,2021-2026年的复合年均增长率为24.8%,人工智能产业正从发展期向成熟期过渡,除AI芯片外的细分技术赛道产业已跨过高速增长期,步入了稳步增长阶段。
在产业增长期,人工智能领域的企业与研究人员正通过结合开源,促使各环节提升经济生产活动效能。如今,在 AI 模型规模更加庞大、算法架构更为复杂、所需训练数据更为巨大和繁杂的情况下,开源可以一定程度上降低研发成本,提高研发效率。通过将已有研发成果汇集于开源代码库中,帮助更多开发者进行技术研发工作,已是人工智能领域的惯例。2022年,在推荐、强化学习、机器人等领域,更多人工智能代码库开源,形成了垂直、活跃的交流社区,助力产业发展。
从研究方向看,人工智能领域的研究人员热爱开源,且热衷于基础性的研究内容,如深度学习开源框架、目标检测开源框架等。此外,图像分类、语义理解、图像分割、文字识别、语音合成等实用性场景同样拥有极高的关注度。
从研究对象看,从早期的文本、图像、音频和视频,渐渐转向3D数据模态。带来的影响是针对数字人的研究得到了空前关注。基于3D的数字人、元宇宙等内容已然成为各大科技公司争相角逐的热点内容。
从产业角度看,人工智能开源项目从原本的小型应用场景(如目标检测、文字识别等),逐渐向大而全的生态系统转变。
从开源单位看,企业的研究院相比高校的实验室,产出了更多有影响力的项目,国内人工智能开源项目所属单位影响力较大的如百度、京东、阿里巴巴、腾讯、字节跳动、商汤、旷视等,可见各大企业近年来在不断加大开源社区生态建设方面的投入。
总体来看,国内在人工智能领域的研究日益广泛,相应的开源项目也层出不穷,许多有影响力的工作均得到了来自全球各地开发者的贡献。开源极大地促进了新技术的形成和新产业的落地。
![](
)**
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录