From 1778b24de06f53faba3ff196cbe975d841d063c8 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?=E8=9E=BA=E6=97=8B=E7=8C=AB=E7=8C=AB=E5=A4=B4?= Date: Fri, 16 Aug 2024 17:09:12 +0800 Subject: [PATCH] =?UTF-8?q?Update=20=E7=AC=AC=E4=BA=8C=E7=AB=A0=5F?= =?UTF-8?q?=E5=BC=80=E6=BA=90=E5=BC=80=E5=8F=91=E8=80=85=E5=8F=8A=E9=A1=B9?= =?UTF-8?q?=E7=9B=AE=E5=8F=91=E5=B1=95=E7=8E=B0=E7=8A=B6.md?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- ...21\345\261\225\347\216\260\347\212\266.md" | 44 +++++++++---------- 1 file changed, 22 insertions(+), 22 deletions(-) diff --git "a/\347\254\254\344\272\214\347\253\240_\345\274\200\346\272\220\345\274\200\345\217\221\350\200\205\345\217\212\351\241\271\347\233\256\345\217\221\345\261\225\347\216\260\347\212\266.md" "b/\347\254\254\344\272\214\347\253\240_\345\274\200\346\272\220\345\274\200\345\217\221\350\200\205\345\217\212\351\241\271\347\233\256\345\217\221\345\261\225\347\216\260\347\212\266.md" index faafcd6..af18348 100644 --- "a/\347\254\254\344\272\214\347\253\240_\345\274\200\346\272\220\345\274\200\345\217\221\350\200\205\345\217\212\351\241\271\347\233\256\345\217\221\345\261\225\347\216\260\347\212\266.md" +++ "b/\347\254\254\344\272\214\347\253\240_\345\274\200\346\272\220\345\274\200\345\217\221\350\200\205\345\217\212\351\241\271\347\233\256\345\217\221\345\261\225\347\216\260\347\212\266.md" @@ -1,4 +1,4 @@ -#第二章 开源开发者及项目发展现状 +# 第二章 开源开发者及项目发展现状 随着开源文化的普及和技术飞速发展,越来越多的开发者投身开源项目,共同促进开源生态的繁荣。作为项目核心动力,开发者从编写、测试到优化代码,持续推动项目进展。同时,他们的多元背景和专长,丰富了开源项目的技术内涵和功能应用。在生成式人工智能大趋势下,开发者积极吸纳新技术,显著提升了项目的智能化、性能、安全性和易用性,共同构建一个开放、协作、创新的生态体系。 @@ -10,9 +10,9 @@ **开源项目数量逐年攀升:**涉及云计算、大数据、人工智能、物联网等多个领域,部分项目已在国际开源社区中取得一定影响力。 -##2.1 开源开发者发展现状 +## 2.1 开源开发者发展现状 -###2.1.1 开源开发者发展概述 +### 2.1.1 开源开发者发展概述 **(一)开发者画像及规模、发展趋势** @@ -81,7 +81,7 @@ AI工具使用情况(图源: CSDN) ![](https://i-blog.csdnimg.cn/direct/bb220db2860c438ea61cef69ecf86198.png#pic_center) 开源与闭源对AI大模型的影响(图源: CSDN) -###2.1.2 开发者在全球开源的投入与贡献分析 +### 2.1.2 开发者在全球开源的投入与贡献分析 选择开源的原因多种多样,其中48%的开发者认为开源协作方式能够显著降低开发成本,34%的人认为可以基于开源软件进行二次开发和定制自己的服务。这样的选择不仅节省资源,还能加速创新,促进技术交流和共享。在这种背景下,开源模式被越来越多的开发者和企业所接受和推广。 除此之外,开放透明的代码和知识共享、众多的社区开发人员支持也是吸引开发者使用开源软件的重要原因。如果没有开源社区、开源活动、开源项目的支持,也不会有今天繁荣的开源生态。 @@ -89,7 +89,7 @@ AI工具使用情况(图源: CSDN) 吸引开发者使用开源软件的因素(图源: CSDN)   -**(一)开源组织和开源活动** +**(1)开源组织和开源活动** 我国开发者发起和主导的开源社区不断发展, 开源项目逐步实现国际化。数据显示,截至2022年,国内已经成立超过500个开源社区,涵盖了数据库、中间件、物联网、微服务、大数据、人工智能、移动互联网、云计算等技术领域。中国开发者主导的开源项目占全球12.5%,中国发起的开源项目海外贡献者占比33.7%。 @@ -134,7 +134,7 @@ AI工具使用情况(图源: CSDN) CSDN主办的第四届“长沙·中国1024程序员节”于2023年10月23 - 24日在长沙盛大举行,本届程序员节以“研发新高地,数智创未来”为主题,设置了岳麓对话、技术英雄会、十多场技术论坛以及编程大赛、创新展览、开发者嘉年华等精彩环节。议题涵盖人工智能、开源、AI模型、数据技术、AI编程与研发效能、自动驾驶与智能制造、信创等热点方向。   -**(二)开源项目开发者贡献发展现状** +**(2)开源项目开发者贡献发展现状** 中国在开源项目上的发展近年来取得了显著成就。据X-Lab数据显示,全球开源仓库OpenRank排名如下: @@ -166,10 +166,10 @@ CSDN主办的第四届“长沙·中国1024程序员节”于2023年10月23 - 24 ![](https://i-blog.csdnimg.cn/direct/6c78d6e966f849eca80dcb7f322f3e00.png#pic_center) 中国企业OpenRank排名变化(图源:开源社) -##2.2开源项目发展现状 -###2.2.1 中国开源项目概况 +## 2.2开源项目发展现状 +### 2.2.1 中国开源项目概况 -**(一)总体概况 ** +**(1)总体概况 ** 首先,统计分析全域 GitHub 的事件⽇志总体数量,如下图所示。 @@ -215,7 +215,7 @@ CSDN主办的第四届“长沙·中国1024程序员节”于2023年10月23 - 24 * Google Code:拥有良好的issue tracker、wiki系统以及Google group/gmail的集成,同时支持svn/mercurial/git三种版本管理,但在中国大陆无法访问。 -(二)GitHub和Gitee的总事件数趋势比较 +**(2)GitHub和Gitee的总事件数趋势比较** 由于GitHub平台活跃事件的庞大,接下来的分析工作,建立在每个平台的前3万个活跃仓库的基准之上。为了方便比较,选取了GitHub与Gitee中与开源参与相关性较大的8类事件进行统计分析,包括CommitCommentEvent、ForkEvent、IssueCommentEvent、IssuesEvent、PullRequestEvent、PullRequestReviewCommentEvent、PushEvent 和 WatchEvent。 @@ -238,7 +238,7 @@ GitHub与Gitee活跃仓库事件类型对比(图源:开源社) 在Gitee平台上,事件数据在2018年有极大的增长,最初以Watch事件为主。但在2020年后,Pull Request、 Review Comment事件开始快速增长,在2022年成为最多的事件类型,并且在2023年也有持续的增长。Gitee事件数据的结构性变化,体现出国内开发者从关注者到贡献者角色的巨大转变,这和全球范围内的观察都是一致的。 -(三)GitLink事件数分析 +**(3)GitLink事件数分析** 对于GitLink平台,同样选择了前3万个活跃仓库作为基准。鉴于数据的局限性,仅选取了包括 CommitCommentEvent、ForkEvent、IssueCommentEvent、IssuesEvent、PullRequestEvent 和 WatchEvent 六种事件类型的数据进行分析。 @@ -247,7 +247,7 @@ GitLink平台事件数据分析(图源:开源社) 观察到,尽管Gitlink的活跃仓库事件数相较 GitHub、Gitee等平台仍存在一定差距,但同样呈现明显的增长趋势。在Gitlink平台上,Issue事件和CommitComment事件占活跃仓库事件的绝大多数。 -###2.2.2 中国项目活跃度与影响力趋势分析 +### 2.2.2 中国项目活跃度与影响力趋势分析 ![](https://i-blog.csdnimg.cn/direct/61a64949ae2d4e088ef2d2585458a4af.png#pic_center) 中国项目活跃度Top10 2019-2023 @@ -262,7 +262,7 @@ OpenHarmony活跃度上升至第2,StarRocks 得益于其良好的开源生态 MindSpore稳居中国开源项目影响力第一,Paddle长期居于第二,OpenHarmony影响力上涨较快,Doris项目近3年排名上涨较快,反映出中国开源项目积极的发展。 -###2.2.3 中国项目活跃度与影响力榜单 +### 2.2.3 中国项目活跃度与影响力榜单 在开源项目洞察这部分,同样根据活跃度和影响力,分别比较了全球和中国排名前20的开源项目,可以看到: @@ -283,7 +283,7 @@ MindSpore稳居中国开源项目影响力第一,Paddle长期居于第二,Op 表4 中国项目影响力Top20 -###2.2.4 基金会旗下中国项目影响力趋势分析 +### 2.2.4 基金会旗下中国项目影响力趋势分析 ![](https://i-blog.csdnimg.cn/direct/fc063aa7d0bb40959852d78b41283c3d.png#pic_center) 中国基金会项目OpenRank变化趋势 @@ -304,9 +304,9 @@ MindSpore稳居中国开源项目影响力第一,Paddle长期居于第二,Op * 排名前三的分别是OpenHarmony、openEuler和Anolis,代表了操作系统绝对的地位,特别是OpenHarmony,发展最为迅速; * 其他上榜项目发展非常平稳,期待后续能够在新的一年中发力。 -##2.3 开发者面临的挑战、建议与未来展望 +## 2.3 开发者面临的挑战、建议与未来展望   -###2.3.1 面临的挑战 +### 2.3.1 面临的挑战 随着开源软件的蓬勃发展,以及人工智能技术的逐渐成熟,也为中国开源领域带来了巨大的挑战。 其一,大模型技术、开源、生成式AI、算力这些热词都是开发者最关注的技术突破方向。而更深远的问题,比如与隐私保护、日常生活息息相关的价值对齐、安全合规等问题,受关注度弱于其他技术突破方向。这可能是因为很多人还未对「人工智能的潜在伦理风险」产生实感,这些情节暂时还存在于电影之中。 @@ -336,10 +336,10 @@ MindSpore稳居中国开源项目影响力第一,Paddle长期居于第二,Op ![](https://i-blog.csdnimg.cn/direct/97f3206255e94a42abff975079297ef1.png#pic_center) 开源软件的安全漏洞(图源:CSDN)   -###2.3.2 建议 +### 2.3.2 建议 基于以上挑战,开源开发需要包括政府、企业、社会组织以及个人开发者的积极参与和支持,以下是一些建议和措施: -(一)加强数据隐私与安全性: +(1)加强数据隐私与安全性: * 数据最小化原则: 在项目中最小化收集和使用个人数据。只收集和使用必要的数据,避免收集不必要的个人信息。 * 用户明示同意: 在收集个人数据之前,确保获得用户的明示同意。用户应该清楚地知道他们的数据将被用于何种目的,并且有权选择是否同意。 @@ -347,7 +347,7 @@ MindSpore稳居中国开源项目影响力第一,Paddle长期居于第二,Op * 数据访问权限控制: 限制对用户数据的访问权限,仅允许有必要权限的人员或系统进行访问,并建立审计机制以监控数据访问情况。 * 社区教育和意识提升: 加强社区成员对隐私保护的意识,教育他们如何保护个人隐私,并提供相应的培训和资源。 -(二)采用有效的方式更好地管理知识产权和许可证,降低法律风险: +(2)采用有效的方式更好地管理知识产权和许可证,降低法律风险: * 开源项目应该制定明确的知识产权政策,包括许可证选择、版权声明、贡献者权利和责任等方面的规定。这有助于消除不确定性,增加项目的透明度和可预测性。 @@ -357,7 +357,7 @@ MindSpore稳居中国开源项目影响力第一,Paddle长期居于第二,Op * 定期审查和更新许可证: 定期审查项目使用的开源许可证,并根据项目的发展和需求进行更新。随着时间的推移,项目的需求和环境可能会发生变化,因此需要不断地审查和更新许可证选择。 * 采用自动化工具: 使用自动化工具来管理知识产权和许可证信息,如软件扫描工具、许可证管理工具等。这些工具可以帮助识别项目中使用的开源组件和其相关的许可证信息,从而更好地管理知识产权和遵守许可证要求。 -(三)维护和支持的可持续性: +(3)维护和支持的可持续性: * 多样化的资金来源: 探索多样化的资金来源,包括个人捐赠、企业赞助、基金会资助等。建立稳定的资金来源有助于项目的长期发展和运营。 * 建立商业模式: 考虑建立基于项目的商业模式,例如提供付费支持和咨询服务、开展培训和认证等。通过商业模式来获得收入,可以支持项目的持续发展和维护。 @@ -365,13 +365,13 @@ MindSpore稳居中国开源项目影响力第一,Paddle长期居于第二,Op * 建立社区参与机制: 建立开放、包容的社区参与机制,鼓励更多的人参与项目的开发和维护。这不仅能够分担项目维护的压力,还能够增加项目的可持续性。   -(四)使用内存安全编程语言。 +(4)使用内存安全编程语言。 随着技术的进步和需求的变化,开发人员逐渐意识到选择适合的编程语言来减少内存管理的风险是明智之举。使用那些在设计时就注重内存安全的语言,可以通过自动内存管理、严格的类型检查和内置的安全特性,显著降低了开发人员引入内存错误的风险。 例如,Rust通过借用检查器和所有权系统,确保在编译时捕获几乎所有的内存错误;Go语言通过垃圾回收机制有效地管理内存;Java同样利用垃圾回收,确保对象的生命周期管理更加安全;Python和Ruby则通过高层次的抽象和动态类型系统,减少了内存管理的复杂度。Swift不仅为iOS和macOS开发提供了强大的功能,同时也通过自动引用计数(ARC)来实现内存安全。   -###2.3.3 未来展望 +### 2.3.3 未来展望 随着数字化转型的不断推进,越来越多的企业和组织意识到开源软件的价值,其在削减成本、提高安全性、推动创新和实现可持续性方面的优势日益显著。开源开发者将继续在推动开源和开源人工智能领域发展中发挥重要作用。他们将继续引领创新,推动技术进步,并积极参与社区建设,促进合作和知识共享。   ![](https://i-blog.csdnimg.cn/direct/bbd477dcd32649fa8d419c174f9b6fd1.png#pic_center) -- GitLab