Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
开源软件推进联盟
《2023 中国开源发展蓝皮书》编制
提交
4529ce2d
《
《2023 中国开源发展蓝皮书》编制
项目概览
开源软件推进联盟
/
《2023 中国开源发展蓝皮书》编制
通知
144
Star
28
Fork
42
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
2
列表
看板
标记
里程碑
合并请求
2
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
《
《2023 中国开源发展蓝皮书》编制
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
2
Issue
2
列表
看板
标记
里程碑
合并请求
2
合并请求
2
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
提交
4529ce2d
编写于
5月 08, 2023
作者:
螺旋猫猫头
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Update 第三章 开源项目发展现状.md
上级
0dbec3c8
变更
1
显示空白变更内容
内联
并排
Showing
1 changed file
with
168 addition
and
15 deletion
+168
-15
第三章 开源项目发展现状.md
第三章 开源项目发展现状.md
+168
-15
未找到文件。
第三章 开源项目发展现状.md
浏览文件 @
4529ce2d
# 第三章 开源项目发展现状
# 第三章 开源项目发展现状
##GitHub中国项目活跃度及趋势
##
GitHub中国项目活跃度及趋势
### 一、中国开源项目的总体现状
通过统计全域 GitHub 事件日志,可以看到近 5 年全球开源的总体活跃情况,各项指标都在明显上升,特别是疫情后,有一个加速上升的趋势。同时活跃仓库数量目前保持着大约 24% 左右的增速,显示了全球开源发展中的增速。
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/971cababa9ae4cb18bb50345c7e8d91e.png#pic_center
)
图1 全球 GitHub 事件日志、活跃仓库、活跃开发者五年趋势图
此节包含近五年中国项目在 GitHub 日志的事件总量、活跃仓库数量、活跃在中国项目上的开发者总量的变化趋势。
在经历了疫情前后的快速增长后,开始处于一个稳定的增长期。中国在2022年的日志事件和活跃仓库数均有明显的增长,相信在国家各项政策性意见的出台下,中国开源的发展会越来越好。
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/f67ebe6918b44a578dab640011804490.png#pic_center
)
图2 中国项目 GitHub 事件日志、活跃仓库、活跃开发者五年趋势图
### 二、中美企业对比
为了更好的展现中国企业在全球范围下的开源贡献整体水平,本报告通过对比美国头部企业参与开源贡献的数据来进行分析,四张表分别为:美国活跃度排名前十的开源贡献企业、中国活跃度排名前十的开源贡献企业、美国开源影响力排名前十的企业、以及中国开源影响力排名前十的企业,可以看到:
-美国的传统互联网大企业任然是活跃度与影响力排名靠前的主要来源。微软由于已使用 GitHub 作为大部分团队的日常开发平台,故项目数量较大,总活跃度第一,与第二名Google的差距逐渐拉大;著名的开源独角兽公司 HashiCorp 也榜上有名。
-中国的情况则是阿里巴巴的项目数量和总活跃度均为国内企业第一,但整体项目体量以及活跃度总量距离美国 Google 等大企业还有一定的差距;而中国的开源初创企业和项目则表现抢眼,按照项目平均活跃度,可以看到如 PingCAP(tidb,tikv)、Baidu(PaddlePaddle)、ESPRESSIF(esp-idf)、StarRocks(StarRocks)都脱颖而出。
-影响力指标更关注开发者生态,在影响力指标下,大体趋势和活跃度指标下的一样,体量上中美存在一定差距,在项目平均影响力上则相当,中国企业映云科技(EMQ)进入榜单,该公司成立于2017年,其主要的开源项目 emqx 有着相当不错的开发者生态。
进一步,本报告也详细分析了中国企业近 5 年的开源发展趋势,包括活跃度趋势与影响力趋势。可以看到阿里巴巴、百度、蚂蚁三家企业长期名列前茅;阿里长期排名榜首,而百度近几年也明显加大了对开源贡献的投入,初创企业 PingCAP 也是一直稳居第四的位置,需要注意的是鼎石科技(StarRocks)在2021年上榜并在2022年达到第8位,其下开源项目StarRocks数据库影响力不容忽视。
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/5e52176747aa4fb59179f3c492920d4e.png#pic_center
)
表1 美国企业活跃度 Top 10
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/26fb70182d9d47fca45c002f07ecfe99.png#pic_center
)
表2 中国企业活跃度 Top 10
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/6e94b7f0a8ca40ae853450b5501f6b08.png#pic_center
)
表3 美国企业影响力 Top 10
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/29b7e266a024491f91b13dd004d70cb4.png#pic_center
)
表4 中国企业影响力 Top 10
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/abf053734a904929baa51f51dc4090fc.png#pic_center
)
图3 中国企业活跃度 Top 10 2018 – 2022
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/e648778a83224e0c9884bb64af2e2e1e.png#pic_center
)
图4 中国企业影响力 Top 10 2018 - 2022
### 三、中国项目情况
在开源项目洞察这块,同样根据活跃度和影响力,分别比较了全球和中国排名前 20 的开源项目,可以看到:
-在单个项目上,中国主导的开源项目的活跃度和影响力距离全球顶级开源项目的活跃度与影响力还有一定的差距,特别是在影响力方面,是一个需要长期建设的生态指标,需要我们最大限度的融入到全球开源生态里面发展我国的开源项目。
-中国主导的开源项目中,来自百度的 PaddlePaddle 相关的两个项目保持上升 活跃度与影响力均位列第一,pingCAP 旗下的两个开源项目(TiDB、TiKV)与 StarRocks旗下的StarRocks数据库则表现不俗。
-在近 5 年的变化趋势上,活跃度方面,PaddlePaddle 相关的两个项目保持上升;影响力方面,shardingsphere 和 metersphere 则稳步上升。
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/1566a74f1b894accbd9f7767d4d43bcc.png#pic_center
)
表5 GitHub 全球项目活跃度 Top 20
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/41e1178405c54b178d3b776bbeb85144.png#pic_center
)
表6 中国项目活跃度 Top 20
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/3c6a9c4e80dc41b290d9dc2ad002238a.png#pic_center
)
表7 全球项目影响力 Top 20
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/7ba8f466bea84334a94631f8327b0586.png#pic_center
)
表8 中国项目影响力 Top 20
**近五年中国活跃度 Top 10 项目变化趋势图**
可以看出 Paddle 项目上升至第 1,tidb 上升至第 2,StarRocks 得益于其良好的开源生态以及全球的推广,在 2021 年上榜,并 2022 年直接上升至第 3 位,
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/074a6bb7504b41d28dbf8bfd6d91227b.png#pic_center
)
图5 中国项目活跃度 Top 10 2018 - 2022
**近五年中国影响力 Top 10 项目变化趋势图**
PaddleOCR 在 2020 年开源以来,活跃度和影响力都飞速进步,很快就进入了顶级项目行列。同样,metersphere 自 2020 年上榜以来影响力逐渐上升。从下图中同样可以看出 2020 年以来项目影响力竞争激烈,反映出中国开源项目积极的发展。
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/9c138ea79ed040019890445af89b2326.png#pic_center
)
图6 中国项目影响力 Top 10 2018 – 2022
### 四、应用领域项目分析
根据对 GitHub 中主流项目应用领域的标签数据,本节绘制了几个热⻔领域近几年项目发展情况,包括依赖包和框架、应用软件、系统软件、软件工具和非软件。
**各子领域影响力变化趋势**
由于当下软件组件化开发的推广,libraries and framework 影响力大幅领先其他领域,application software 和 software tools 影响力有一定上升趋势。
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/1a6dcc5d5bbd4d34bd57d4999d5294dc.png#pic_center
)
图7 应用领域子领域影响力2018 – 2022
**各子领域活跃度变化趋势**
与影响力指标类似,libraries and framework 在活跃度方面也大幅领先其他领域。
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/f1d8f2f9a559485b9774e9f1e8710f82.png#pic_center
)
图8 应用领域子领域活跃度2018 – 2022
**近五年应用领域项目影响力 Top 10 项目变化趋势图**
_依赖包和框架_
flutter 项目常年稳居第一,百度 paddle 影响力持续增长。
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/40efff77c5dc4be7afa5ec2102dc11f3.png#pic_center
)
图9 依赖包和框架影响力TOP 10 2018 – 2022
_应用软件_
home-assistant/core 项目影响力增长明显并且与其他项目逐渐拉开差距,该领域下的 top 10 项目影响力均有不同程度的增长
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/3954ca8d92f2461394a0b1d5395b5886.png#pic_center
)
图10 应用软件影响力TOP 10 2018 – 2022
_系统软件_
nixpkgs 作为系统包管理工具是 Github 最活跃的项目之一,而 k8s 项目的影响力有所下降
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/67d0cecfa95d4431bce1d4c7d5c0b5e4.png#pic_center
)
图11 系统软件影响力TOP 10 2018 – 2022
_软件工具_
vscode 作为软件开发工具之一,深受广大开发者的喜爱,影响力常年位居第一,dotnet/runtime 项目在 2020 年影响力迅速增长位居第二。
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/df5861f09da0412cb87dea83736621a9.png#pic_center
)
图12 软件工具影响力TOP 10 2018 – 2022
_非软件_
非软件类项目主要以项目文档为主,其中 azure-docs 影响力常年位居第一
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/f5a8fec3eadc4b1f98e1c428a628cc2e.png#pic_center
)
图13 非软件影响力TOP 10 2018 – 2022
### 五、数据库领域项目分析
本小节从数据库领域角度出发,分别给出了数据库领域影响力和活跃度 Top 10 项目、数据库各子领域 Top 5 影响力和活跃度变化趋势以及近 5 年 Top 10 项目的影响力变化趋势
**数据库领域影响力 Top 10**
可以看出 Clickhouse 活跃度和影响力稳居第一,elasticsearch 其次。ClickHouse 是俄罗斯的 Yandex 于 2016 年开源的用于在线分析处理查询 MPP 架构的列式存储数 据库作为高性能的 OLAP 数据库,其性能十分优越,查询速度极快。
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/00ad60884e7a4bc4a725ab307c5c7dc7.png#pic_center
)
表9 数据库领域影响力 Top 10
**数据库领域活跃度 Top 10**
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/5f6e725e60e6447ca3406cc2611ff1e8.png#pic_center
)
表10 数据库领域活跃度 Top 10
数据库领域项目 Top 10 影响力变化趋势
从下图可以看出 Clickhouse 双指标均在2022年上升至第一位,elasticsearch 和 spark 有一定的回落,排名较后的项目双指标均有不同程度的增长。
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/82104650900a4899877cb3b6d961ddfe.png#pic_center
)
图14 数据库领域项目影响力TOP 10 2018 – 2022
**数据库领域项目 Top 10 活跃度变化趋势**
从趋势图中可以看出,在 2018-2020 年项目之间的活跃度差距较为明显,在 2022 年竞争逐渐激烈,反映出数据库项目积极的发展。
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/6f1acade92224eaaadfa207f5075ee30.png#pic_center
)
图15 数据库领域项目活跃度TOP 10 2018 – 2022
**数据库各子领域 Top 5 影响力变化趋势**
本节给出了数据库下各个主要子领域的影响力变化趋势,从趋势图可以看到,关系型数据库连年位居第一且影响力不断增长,其他类型数据库影响力均处于稳定期。
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/016c062e1d914102b36b5e4b4049d3fd.png#pic_center
)
图16 数据库子领域影响力TOP 5 2018 – 2022
**数据库各子领域 Top 5 活跃度变化趋势**
本节给出了数据库下各个主要子领域的活跃度变化趋势,从趋势图可以看到,关系型数据库活跃度在2022年增长迅速,其他类型数据库活跃度每年相对稳定。
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/2df3a72569ac4412abdccdb00d294e4c.png#pic_center
)
图17 数据库子领域活跃度TOP 5 2018 – 2022
### 六、编程语言 Top 10 排行榜
从下表中可以看出 JavaScript 仍然是当前最热门的编程语言,Python紧随其后。
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/111f92c5f2e446528b5d33a3fb5c10e7.png#pic_center
)
表11 编程语言 Top 10 排行榜
...
@@ -29,18 +182,18 @@ OpenHarmony是开放原子基金会旗下另外一个重要的开源操作系统
...
@@ -29,18 +182,18 @@ OpenHarmony是开放原子基金会旗下另外一个重要的开源操作系统
从生态上看,应用软件特别是专业应用软件的缺失,硬件(包括显卡驱动,指纹识别器和一些特殊硬件等)驱动支持不足仍然是制约国内桌面Linux操作系统普及的重要原因。
从生态上看,应用软件特别是专业应用软件的缺失,硬件(包括显卡驱动,指纹识别器和一些特殊硬件等)驱动支持不足仍然是制约国内桌面Linux操作系统普及的重要原因。
##开源与云计算的现状
##
开源与云计算的现状
云计算如今已是IT业界的主流技术,越来越多的用户选择云计算平台作为自己软件业务的基础设施,而云计算业务带来的IT产业营收比重也越发凸显。云计算的概念从上世纪八十年代发端,到真正成型落地广为人知,开源理念和开源软件在其中起到了决定性的推动作用。首先系统软件里,以Linux为代表的开源的操作系统是云计算软件技术栈里坚实的基础,还有开源的虚拟化技术对于计算资源的池化也是必不可少的一环,包括Xen,KVM,QEMU等开源项目。云计算技术需要管理的资源,除了计算资源之外,网络资源和存储资源也是缺一不可的,同样,在网络技术软件栈和存储技术软件栈里,各种逐渐成熟的开源技术和开放标准,也加速了云计算时代的到来。作为云计算产业的先锋Amazon AWS,不可否认就是架构在这一系列的开源软件之上的。在AWS稳定的技术表现和成功的商业模式的带动下,一系列开源的云计算基础架构管理软件风起云涌,而时至今日,OpenStack最终成为最为成功和唯一事实上的标准云基础设施开放平台。
云计算如今已是IT业界的主流技术,越来越多的用户选择云计算平台作为自己软件业务的基础设施,而云计算业务带来的IT产业营收比重也越发凸显。云计算的概念从上世纪八十年代发端,到真正成型落地广为人知,开源理念和开源软件在其中起到了决定性的推动作用。首先系统软件里,以Linux为代表的开源的操作系统是云计算软件技术栈里坚实的基础,还有开源的虚拟化技术对于计算资源的池化也是必不可少的一环,包括Xen,KVM,QEMU等开源项目。云计算技术需要管理的资源,除了计算资源之外,网络资源和存储资源也是缺一不可的,同样,在网络技术软件栈和存储技术软件栈里,各种逐渐成熟的开源技术和开放标准,也加速了云计算时代的到来。作为云计算产业的先锋Amazon AWS,不可否认就是架构在这一系列的开源软件之上的。在AWS稳定的技术表现和成功的商业模式的带动下,一系列开源的云计算基础架构管理软件风起云涌,而时至今日,OpenStack最终成为最为成功和唯一事实上的标准云基础设施开放平台。
同时,在过去几年里,容器化和容器资源的管理,也逐渐走向成熟,并快速被广大开发人员和厂商所采用,也标志了云(计算)原生时代的到来。在此中起关键作用的还是几个核心的开源软件项目,首先是Linux kernel里的几个核心技术带来了容器化的可能,然后Docker工具横空出世让业界快速拥抱了容器技术,容器资源从单节点走向大规模集群的过程中,Kubernetes渐渐成为了容器资源调度和编排的事实标准,可称为云原生时代的云操作系统。
同时,在过去几年里,容器化和容器资源的管理,也逐渐走向成熟,并快速被广大开发人员和厂商所采用,也标志了云(计算)原生时代的到来。在此中起关键作用的还是几个核心的开源软件项目,首先是Linux kernel里的几个核心技术带来了容器化的可能,然后Docker工具横空出世让业界快速拥抱了容器技术,容器资源从单节点走向大规模集群的过程中,Kubernetes渐渐成为了容器资源调度和编排的事实标准,可称为云原生时代的云操作系统。
存储服务支撑了应用的状态、数据的持久化,是应用得以运行的基础。云原生存储是一种用于云原生环境的存储技术,是云原生的重要组成部分,特征主要包括可用性、可扩展性、高性能、一致性以及持久性等。近年来我国出现了一批优秀成熟的开源云原生存储项目,具有代表性的有PingCap的分布式事务键值数据库TiKV,阿里巴巴的云原生镜像分发系统Dragonfly和分布式内存数据管理引擎Vineyard,以及OPPO为大规模容器平台设计的分布式文件系统CubeFS等。
存储服务支撑了应用的状态、数据的持久化,是应用得以运行的基础。云原生存储是一种用于云原生环境的存储技术,是云原生的重要组成部分,特征主要包括可用性、可扩展性、高性能、一致性以及持久性等。近年来我国出现了一批优秀成熟的开源云原生存储项目,具有代表性的有PingCap的分布式事务键值数据库TiKV,阿里巴巴的云原生镜像分发系统Dragonfly和分布式内存数据管理引擎Vineyard,以及OPPO为大规模容器平台设计的分布式文件系统CubeFS等。
###开源与云计算的趋势、挑战和机遇
###
开源与云计算的趋势、挑战和机遇
2022年,随着云基础设施、网络和存储等技术发展的深入,以及以容器和微服务为代表的云原生技术兴起,云计算的发展呈现出如下的趋势,也带来了新的挑战与机遇。
2022年,随着云基础设施、网络和存储等技术发展的深入,以及以容器和微服务为代表的云原生技术兴起,云计算的发展呈现出如下的趋势,也带来了新的挑战与机遇。
**绿色云计算**
**绿色云计算
:
**
也有场合称作可持续计算(Sustainable Computing),随着云计算的普及,数据中心作为云计算的基础设施,消耗大量电力并产生大量温室气体排放,数据中心的能耗和碳排放问题日益严重,政府、企业和公众对此越来越关注。一方面能源成本上升使得运营数据中心的成本增加,为降低成本,企业开始寻求能效更高的解决方案,另一方面,各国政府对于碳排放的限制和法规,以及环保组织的倡导,促使企业采取更环保的措施。绿色云计算是指在云计算环境中采取节能、低碳、环保的方法和技术,以减少能源消耗、降低运营成本并减缓气候变化。绿色云计算的目标是在维持服务质量的同时,降低能源消耗和环境影响。
也有场合称作可持续计算(Sustainable Computing),随着云计算的普及,数据中心作为云计算的基础设施,消耗大量电力并产生大量温室气体排放,数据中心的能耗和碳排放问题日益严重,政府、企业和公众对此越来越关注。一方面能源成本上升使得运营数据中心的成本增加,为降低成本,企业开始寻求能效更高的解决方案,另一方面,各国政府对于碳排放的限制和法规,以及环保组织的倡导,促使企业采取更环保的措施。绿色云计算是指在云计算环境中采取节能、低碳、环保的方法和技术,以减少能源消耗、降低运营成本并减缓气候变化。绿色云计算的目标是在维持服务质量的同时,降低能源消耗和环境影响。
...
@@ -52,31 +205,31 @@ OpenHarmony是开放原子基金会旗下另外一个重要的开源操作系统
...
@@ -52,31 +205,31 @@ OpenHarmony是开放原子基金会旗下另外一个重要的开源操作系统
最后,人们还可以采用智能能源管理系统,实时监控数据中心的能源消耗,采取节能措施以优化资源分配。许多大型数据中心都在采用绿色云计算技术,以降低能源消耗和环境影响。绿色云计算已经成为一个重要的议题,越来越多的企业、政府和组织开始关注并采取措施降低云计算对环境的影响。通过实施绿色云计算技术和策略,我们可以在享受云计算带来的便利和效率的同时,保护地球环境。
最后,人们还可以采用智能能源管理系统,实时监控数据中心的能源消耗,采取节能措施以优化资源分配。许多大型数据中心都在采用绿色云计算技术,以降低能源消耗和环境影响。绿色云计算已经成为一个重要的议题,越来越多的企业、政府和组织开始关注并采取措施降低云计算对环境的影响。通过实施绿色云计算技术和策略,我们可以在享受云计算带来的便利和效率的同时,保护地球环境。
**人工智能和机器学习**
**人工智能和机器学习
:
**
随着大数据和计算能力的发展,人工智能(AI)和机器学习(ML)技术在过去的几年里取得了显著的进展,它可以应用于如自动驾驶、金融风控、智能医疗和智能制造等各个领域。企业和研究机构对于利用人工智能和机器学习技术解决复杂问题和提高工作效率的需求日益增长。
随着大数据和计算能力的发展,人工智能(AI)和机器学习(ML)技术在过去的几年里取得了显著的进展,它可以应用于如自动驾驶、金融风控、智能医疗和智能制造等各个领域。企业和研究机构对于利用人工智能和机器学习技术解决复杂问题和提高工作效率的需求日益增长。
2022年,ChatGPT的流行更是把人工智能发展推向了新高潮,ChatGPT是一款由OpenAI开发的大型自然语言处理(NLP)模型,基于GPT-4架构。它可以理解和生成自然语言文本,广泛应用于聊天机器人、自动摘要、翻译等多个领域,它深刻地影响着我们的生活、工作和学习的方方面面。
2022年,ChatGPT的流行更是把人工智能发展推向了新高潮,ChatGPT是一款由OpenAI开发的大型自然语言处理(NLP)模型,基于GPT-4架构。它可以理解和生成自然语言文本,广泛应用于聊天机器人、自动摘要、翻译等多个领域,它深刻地影响着我们的生活、工作和学习的方方面面。
在这个爆发式增长的行业里,云计算为工智能和机器学习提供了基础算力服务,云计算提供商如谷歌、亚马逊和微软,不仅提供了一系列预构建的人工智能和机器学习服务AI-as-a-Service (AIaaS),如语音识别、图像识别和自然语言处理等,使企业能够轻松集成和部署AI功能,而且还提供了强大的分布式计算能力,支持在多台计算机上并行执行机器学习训练任务,从而缩短训练时间。除此之外,云计算提供商还提供了基于GPU和专用AI芯片(如谷歌TPU)的计算资源,为AI提供了强大的计算能力。
在这个爆发式增长的行业里,云计算为工智能和机器学习提供了基础算力服务,云计算提供商如谷歌、亚马逊和微软,不仅提供了一系列预构建的人工智能和机器学习服务AI-as-a-Service (AIaaS),如语音识别、图像识别和自然语言处理等,使企业能够轻松集成和部署AI功能,而且还提供了强大的分布式计算能力,支持在多台计算机上并行执行机器学习训练任务,从而缩短训练时间。除此之外,云计算提供商还提供了基于GPU和专用AI芯片(如谷歌TPU)的计算资源,为AI提供了强大的计算能力。
**云原生技术**
**云原生技术
:
**
在如今的云下半场中,如火如荼的云原生技术是云计算发展的主线。在CNCF基金会对云原生技术的解释中提到,云原生要用一个开源软件栈解决三个问题:一是把软件应用程序切分为多个微服务;二是把每个部分打包成容器;三是动态地编排这些容器以优化系统资源。因此,把一个单体软件应用解耦成许多微服务,并让这些微服务在各自的容器中高效协作,是云原生的重要内容和发展方向。
在如今的云下半场中,如火如荼的云原生技术是云计算发展的主线。在CNCF基金会对云原生技术的解释中提到,云原生要用一个开源软件栈解决三个问题:一是把软件应用程序切分为多个微服务;二是把每个部分打包成容器;三是动态地编排这些容器以优化系统资源。因此,把一个单体软件应用解耦成许多微服务,并让这些微服务在各自的容器中高效协作,是云原生的重要内容和发展方向。
相对于物理机和虚拟机而言,容器是很轻量化的技术,在等量资源的基础上能创建出更多的容器实例是当下紧迫需求,容器或微服务都需要接受管理并有序接入外部环境,从而完成调度、负载均衡、分配等任务。简单且高效地管理快速增长的容器实例,是容器编排系统的主要任务,而Kubernetes就是容器编排和管理系统中的最佳选择。Kubernetes的核心是如何解决自动部署、扩展和管理容器化(Containerized)应用程序。未来,随着云原生技术的成熟和发展,企业会更多地采用云原生技术,而Kubernetes可能会继续发展,成为云原生应用部署和管理的事实标准。
相对于物理机和虚拟机而言,容器是很轻量化的技术,在等量资源的基础上能创建出更多的容器实例是当下紧迫需求,容器或微服务都需要接受管理并有序接入外部环境,从而完成调度、负载均衡、分配等任务。简单且高效地管理快速增长的容器实例,是容器编排系统的主要任务,而Kubernetes就是容器编排和管理系统中的最佳选择。Kubernetes的核心是如何解决自动部署、扩展和管理容器化(Containerized)应用程序。未来,随着云原生技术的成熟和发展,企业会更多地采用云原生技术,而Kubernetes可能会继续发展,成为云原生应用部署和管理的事实标准。
**云安全**
**云安全
:
**
云计算的基础是资源共享,随着越来越多的企业将其基础设施迁移到云端,云安全将成为关键领域。云提供商可能会继续加大投资以确保客户的数据安全,并采取更严格的合规和隐私政策,因此未来安全服务在云计算的发展过程中越来越重要。众所周知,数据在存储态和传输态时都已经有相应的加密机制对其进行有效保护,保障了数据的机密性和完整性,而数据在使用态时的保护正亟需新的技术填补空白。机密计算(Confidential Computing)正是基于硬件的受信任执行环境中执行计算来保护正在使用的数据,它基于建立硬件的可信执行环境(Trusted Execution Environment,TEE),如英特尔SGX和TDX,ARM TrustZone,AMD SEV/SEV-ES/SEV-SNP、RISC-V Keystone等技术,为数据在云原生环境中的安全使用提供保障。随着容器化和微服务架构的普及,确保这些技术的安全性可能会成为一个关键议题。云服务提供商和企业可能会采取更多措施来保护容器和微服务,包括运行时保护、网络隔离和加密等。目前在CNCF中就有Inclavare Containers和 Confidential Containers等开源机密计算项目,它们已经成为云安全的新趋势。
云计算的基础是资源共享,随着越来越多的企业将其基础设施迁移到云端,云安全将成为关键领域。云提供商可能会继续加大投资以确保客户的数据安全,并采取更严格的合规和隐私政策,因此未来安全服务在云计算的发展过程中越来越重要。众所周知,数据在存储态和传输态时都已经有相应的加密机制对其进行有效保护,保障了数据的机密性和完整性,而数据在使用态时的保护正亟需新的技术填补空白。机密计算(Confidential Computing)正是基于硬件的受信任执行环境中执行计算来保护正在使用的数据,它基于建立硬件的可信执行环境(Trusted Execution Environment,TEE),如英特尔SGX和TDX,ARM TrustZone,AMD SEV/SEV-ES/SEV-SNP、RISC-V Keystone等技术,为数据在云原生环境中的安全使用提供保障。随着容器化和微服务架构的普及,确保这些技术的安全性可能会成为一个关键议题。云服务提供商和企业可能会采取更多措施来保护容器和微服务,包括运行时保护、网络隔离和加密等。目前在CNCF中就有Inclavare Containers和 Confidential Containers等开源机密计算项目,它们已经成为云安全的新趋势。
**5G与云计算融合**
**5G与云计算融合
:
**
5G(第五代移动通信技术)和云计算的结合为各种行业和应用带来了巨大的潜力。5G技术提供了更高的带宽、更低的延迟和更强的连接密度,这些特点使得5G与云计算的融合可以大幅提升现有应用的性能,同时创造出全新的应用场景。
5G(第五代移动通信技术)和云计算的结合为各种行业和应用带来了巨大的潜力。5G技术提供了更高的带宽、更低的延迟和更强的连接密度,这些特点使得5G与云计算的融合可以大幅提升现有应用的性能,同时创造出全新的应用场景。
譬如,边缘计算是一种将计算资源和服务部署在网络边缘(靠近数据源或用户)的技术。在某种意义上,边缘计算可以认为是云计算的扩展和延伸。边缘计算发展到今天,5G的低延迟特性使得边缘计算成为现实,可以在云计算和本地设备之间实现更高效的资源分配,但是构建分布式边缘计算基础设施工具和架构仍处于初级阶段,在边缘计算技术发展里,仍有诸多问题有待解决。国内厂商发起的KubeEdge、OpenYurt、SuperEdge等开源项目继续推进,通过边缘自治,云边流量治理,边缘设备管理等功能来实现云边协同。边缘计算可以减少数据传输延迟,提高实时性能,特别适用于自动驾驶、工业自动化、增强现实(AR)和虚拟现实(VR)等应用场景,这些边缘应用场景都是5G与云计算融合的典型案例。
譬如,边缘计算是一种将计算资源和服务部署在网络边缘(靠近数据源或用户)的技术。在某种意义上,边缘计算可以认为是云计算的扩展和延伸。边缘计算发展到今天,5G的低延迟特性使得边缘计算成为现实,可以在云计算和本地设备之间实现更高效的资源分配,但是构建分布式边缘计算基础设施工具和架构仍处于初级阶段,在边缘计算技术发展里,仍有诸多问题有待解决。国内厂商发起的KubeEdge、OpenYurt、SuperEdge等开源项目继续推进,通过边缘自治,云边流量治理,边缘设备管理等功能来实现云边协同。边缘计算可以减少数据传输延迟,提高实时性能,特别适用于自动驾驶、工业自动化、增强现实(AR)和虚拟现实(VR)等应用场景,这些边缘应用场景都是5G与云计算融合的典型案例。
再譬如,在物联网(IoT)领域,5G技术可以支持更高的连接密度,这意味着大量的物联网设备可以同时连接到网络。与云计算相结合,物联网应用可以实现更高的数据处理能力、智能分析和远程管理,这对于智能城市、智能交通和智能家居等领域具有重要意义。随着5G技术的不断发展和推广,它将与云计算形成更紧密的结合,创造出更多创新应用,为各种行业和领域带来巨大的商业价值和社会影响。可以说,5G和云计算的融合将成为推动数字化转型和智能化发展的关键力量。
再譬如,在物联网(IoT)领域,5G技术可以支持更高的连接密度,这意味着大量的物联网设备可以同时连接到网络。与云计算相结合,物联网应用可以实现更高的数据处理能力、智能分析和远程管理,这对于智能城市、智能交通和智能家居等领域具有重要意义。随着5G技术的不断发展和推广,它将与云计算形成更紧密的结合,创造出更多创新应用,为各种行业和领域带来巨大的商业价值和社会影响。可以说,5G和云计算的融合将成为推动数字化转型和智能化发展的关键力量。
##开源与人工智能
##
开源与人工智能
###大型自然语言处理预训练模型
###
大型自然语言处理预训练模型
近年来,随着深度学习的发展和大规模数据的积累,自然语言模型的规模和性能都有了显著的提升。2022年11月,OpenAI发布正式发布ChatGPT,仅仅2个月后,其成为迄今为止用户数最快破亿的应用,使自然语言处理(NLP)及大型自然语言模型(LLM)成为2023年最受关注的科技话题。自然语言模型的应用已进入快速发展和变革的时期,对高校学习、科研、产业应用、投融资等各社会组织活动将产生重大影响。
近年来,随着深度学习的发展和大规模数据的积累,自然语言模型的规模和性能都有了显著的提升。2022年11月,OpenAI发布正式发布ChatGPT,仅仅2个月后,其成为迄今为止用户数最快破亿的应用,使自然语言处理(NLP)及大型自然语言模型(LLM)成为2023年最受关注的科技话题。自然语言模型的应用已进入快速发展和变革的时期,对高校学习、科研、产业应用、投融资等各社会组织活动将产生重大影响。
**中国自然语言大模型发展情况**
**中国自然语言大模型发展情况**
...
@@ -118,8 +271,8 @@ ChatGPT和GPT-4的成功证明,模型架构是决定大规模预训练语言
...
@@ -118,8 +271,8 @@ ChatGPT和GPT-4的成功证明,模型架构是决定大规模预训练语言
截至2023年3月,OpenAI仍未对GPT-3.5及GPT-4进行开源计划的发布,限制了其他研究者基于此的改进和创新,阻碍了模型的可解释性,也增加了模型被滥用和误用的风险。基于此,我国可以充分发挥制度优势,在中立机构的组织和协调下,团结各研究和开发力量,整合算力、数据资源,以开源开放方式进行大模型的研究与开发工作。通过开源协作,不仅能够提高我国在自然语言处理领域的技术水平和竞争力,也能够为全球社会贡献一种更公平、更透明、更可信赖的人工智能服务。同时,通过建立统一的标准和规范,我们也可以有效地保护用户隐私、维护网络安全、防止信息偏见和歧视等问题。
截至2023年3月,OpenAI仍未对GPT-3.5及GPT-4进行开源计划的发布,限制了其他研究者基于此的改进和创新,阻碍了模型的可解释性,也增加了模型被滥用和误用的风险。基于此,我国可以充分发挥制度优势,在中立机构的组织和协调下,团结各研究和开发力量,整合算力、数据资源,以开源开放方式进行大模型的研究与开发工作。通过开源协作,不仅能够提高我国在自然语言处理领域的技术水平和竞争力,也能够为全球社会贡献一种更公平、更透明、更可信赖的人工智能服务。同时,通过建立统一的标准和规范,我们也可以有效地保护用户隐私、维护网络安全、防止信息偏见和歧视等问题。
##开源区块链项目现状介绍
##
开源区块链项目现状介绍
**一、
2022-2023 年该领域发展现状**
**一、2022-2023 年该领域发展现状**
区块链技术是融合共识机制、密码学算法、智能合约的分布式账本技术,具备可追溯、不可篡改、公开透明等特性。区块链技术概念起源于比特币白皮书,但由于比特币系统技术栈中脚本语言的可编程性限制,早期的区块链生态局限在以比特币为代表的多个独立数字货币系统。2015年,以太坊系统引入图灵完备的通用编程语言作为合约开发语言,以太坊上快速涌现出一批数字资产驱动的金融类创新项目。区块链技术的迅猛发展得到各国政府和产学研界的广泛关注,在政策支持及市场驱动下,国内外诞生了一批拥有不同技术特点的区块链底层平台,应用场景也从金融领域拓展到各行各业。
区块链技术是融合共识机制、密码学算法、智能合约的分布式账本技术,具备可追溯、不可篡改、公开透明等特性。区块链技术概念起源于比特币白皮书,但由于比特币系统技术栈中脚本语言的可编程性限制,早期的区块链生态局限在以比特币为代表的多个独立数字货币系统。2015年,以太坊系统引入图灵完备的通用编程语言作为合约开发语言,以太坊上快速涌现出一批数字资产驱动的金融类创新项目。区块链技术的迅猛发展得到各国政府和产学研界的广泛关注,在政策支持及市场驱动下,国内外诞生了一批拥有不同技术特点的区块链底层平台,应用场景也从金融领域拓展到各行各业。
区块链底层平台(以下简称区块链平台)是搭建区块链系统的关键基础设施,提供网络通信、分布式共识、合约执行、数据存储等基础功能,为各行业区块链应用落地提供支持。本文对比了国内区块链开源平台(见表1)与具备一定影响力的国外区块链开源平台(见表2)。由于本文重点关注我国区块链开源进展,国内区块链开源平台通过汇总行业白皮书、区块链信息服务备案文件、可信区块链测评、公开征集等多种渠道搜集得到,而国外区块链开源平台由于数量较多,仅遴选了star数在1000以上的知名区块链平台。
区块链底层平台(以下简称区块链平台)是搭建区块链系统的关键基础设施,提供网络通信、分布式共识、合约执行、数据存储等基础功能,为各行业区块链应用落地提供支持。本文对比了国内区块链开源平台(见表1)与具备一定影响力的国外区块链开源平台(见表2)。由于本文重点关注我国区块链开源进展,国内区块链开源平台通过汇总行业白皮书、区块链信息服务备案文件、可信区块链测评、公开征集等多种渠道搜集得到,而国外区块链开源平台由于数量较多,仅遴选了star数在1000以上的知名区块链平台。
...
@@ -154,7 +307,7 @@ ChatGPT和GPT-4的成功证明,模型架构是决定大规模预训练语言
...
@@ -154,7 +307,7 @@ ChatGPT和GPT-4的成功证明,模型架构是决定大规模预训练语言
在加密资产应用场景上,2022年加密资产市场行情整体低迷,市值缩水严重,以DeFi为代表的热门赛道锁仓量腰斩。Terra崩盘、FTX集团申请破产等事件使投资者遭受重大损失,严重打击市场信心。尽管NFT数字藏品在年初开启了市场新一轮热度,但在年中达到峰值后持续降低。相比国外,国内的数字藏品在上半年也同样火热,但由于禁止二级市场交易与价格炒作、强调收藏属性,行业逐渐回归理性。在产业应用场景上,我国在政务协同、司法存证、供应链溯源等重点领域探索出可行的区块链应用方案,并通过开展国家区块链创新应用试点工作形成可复制推广的典型案例和做法经验。
在加密资产应用场景上,2022年加密资产市场行情整体低迷,市值缩水严重,以DeFi为代表的热门赛道锁仓量腰斩。Terra崩盘、FTX集团申请破产等事件使投资者遭受重大损失,严重打击市场信心。尽管NFT数字藏品在年初开启了市场新一轮热度,但在年中达到峰值后持续降低。相比国外,国内的数字藏品在上半年也同样火热,但由于禁止二级市场交易与价格炒作、强调收藏属性,行业逐渐回归理性。在产业应用场景上,我国在政务协同、司法存证、供应链溯源等重点领域探索出可行的区块链应用方案,并通过开展国家区块链创新应用试点工作形成可复制推广的典型案例和做法经验。
**二、
问题与挑战**
**二、问题与挑战**
尽管我国有部分开源的区块链平台及配套组件,诞生了一批与实体行业结合的落地应用,但在开源领域还面临诸多挑战。
尽管我国有部分开源的区块链平台及配套组件,诞生了一批与实体行业结合的落地应用,但在开源领域还面临诸多挑战。
...
@@ -163,7 +316,7 @@ ChatGPT和GPT-4的成功证明,模型架构是决定大规模预训练语言
...
@@ -163,7 +316,7 @@ ChatGPT和GPT-4的成功证明,模型架构是决定大规模预训练语言
-区块链开源项目的生态建设机制、社区治理机制尚不明朗,大多数项目由单家机构维护管理,行业联盟分布式协作治理程度较低。
-区块链开源项目的生态建设机制、社区治理机制尚不明朗,大多数项目由单家机构维护管理,行业联盟分布式协作治理程度较低。
-缺乏具有认可度的开源测试框架、测试工具与测试数据集,关键性能指标可对比性不足。
-缺乏具有认可度的开源测试框架、测试工具与测试数据集,关键性能指标可对比性不足。
**三、
前景、趋势与机遇**
**三、前景、趋势与机遇**
-开源已成为软件发展的主流趋势,区块链作为构建分布式可信环境的关键技术,天然地在开源土壤中孕育成长。随着区块链技术的普及、软件社区对开源重视度的提升,是否开源将成为使用方选择区块链平台的重要指标。
-开源已成为软件发展的主流趋势,区块链作为构建分布式可信环境的关键技术,天然地在开源土壤中孕育成长。随着区块链技术的普及、软件社区对开源重视度的提升,是否开源将成为使用方选择区块链平台的重要指标。
...
@@ -171,7 +324,7 @@ ChatGPT和GPT-4的成功证明,模型架构是决定大规模预训练语言
...
@@ -171,7 +324,7 @@ ChatGPT和GPT-4的成功证明,模型架构是决定大规模预训练语言
-尽管国内外的政策环境不同,但开放是区块链的可信基础逐渐成为区块链从业者的共识。尽管目前我国应用场景以封闭的行业联盟链为主,但未来可能会诞生更多的开放联盟链、无币公链等提升开放能力。
-尽管国内外的政策环境不同,但开放是区块链的可信基础逐渐成为区块链从业者的共识。尽管目前我国应用场景以封闭的行业联盟链为主,但未来可能会诞生更多的开放联盟链、无币公链等提升开放能力。
**四、
发展建议**
**四、发展建议**
-为扩大我国区块链开源社区的影响力,建议由具备一定影响力的行业协会牵头,联合开源底层平台的项目发布方、企事业单位、行业协会等,组建区块链开源联盟,设立联盟章程,通过制定区块链开源规范、举办区块链开源大会、定期发布开源发展报告等形式凝聚我国区块链开源社区力量。
-为扩大我国区块链开源社区的影响力,建议由具备一定影响力的行业协会牵头,联合开源底层平台的项目发布方、企事业单位、行业协会等,组建区块链开源联盟,设立联盟章程,通过制定区块链开源规范、举办区块链开源大会、定期发布开源发展报告等形式凝聚我国区块链开源社区力量。
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录