From f1177dcbdf2d280eeb6e243bd442d8bf14db8dd8 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?=E5=8E=86=E5=8F=B2=E4=B8=8A=E7=9A=84=E4=BB=8A=E5=A4=A9?= <492178704@qq.com> Date: Thu, 1 Jun 2023 15:51:18 +0800 Subject: [PATCH] =?UTF-8?q?Update=20=E7=AC=AC=E4=B8=80=E7=AB=A0=5F?= =?UTF-8?q?=E5=BC=80=E6=BA=90=E7=9A=84=E5=9F=BA=E6=9C=AC=E6=A6=82=E5=BF=B5?= =?UTF-8?q?.md?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- ...72\346\234\254\346\246\202\345\277\265.md" | 250 ++---------------- 1 file changed, 15 insertions(+), 235 deletions(-) diff --git "a/\345\215\260\345\210\267\347\211\210\357\274\210\347\256\200\347\211\210\357\274\211/\347\254\254\344\270\200\347\253\240_\345\274\200\346\272\220\347\232\204\345\237\272\346\234\254\346\246\202\345\277\265.md" "b/\345\215\260\345\210\267\347\211\210\357\274\210\347\256\200\347\211\210\357\274\211/\347\254\254\344\270\200\347\253\240_\345\274\200\346\272\220\347\232\204\345\237\272\346\234\254\346\246\202\345\277\265.md" index 3a3afe2..0c5e53d 100644 --- "a/\345\215\260\345\210\267\347\211\210\357\274\210\347\256\200\347\211\210\357\274\211/\347\254\254\344\270\200\347\253\240_\345\274\200\346\272\220\347\232\204\345\237\272\346\234\254\346\246\202\345\277\265.md" +++ "b/\345\215\260\345\210\267\347\211\210\357\274\210\347\256\200\347\211\210\357\274\211/\347\254\254\344\270\200\347\253\240_\345\274\200\346\272\220\347\232\204\345\237\272\346\234\254\346\246\202\345\277\265.md" @@ -78,7 +78,7 @@ Linux的诞生、发展和成长过程始终依赖着五个重要支柱:UNIX 1993年6月17日,Slackware Linux由Patrick Volkerding发布,这是第一个取得广泛成功的Linux发行版。8月16日,Ian Murdock(Debian中的“ian”)发布了第一个Debian Linux发行版。Debian是最有影响力的Linux发行版之一,是MEPIS、Mint、Ubuntu等的鼻祖。8月19日,Matt Welsh写的《Linux Installation and Getting Started》第1版出版,这是第一本关于Linux的书籍。 -1994年3月14日,Linux内核V1.0发布,它支持基于i386单处理器的计算机系统。8月15日 , William R. Della Croce, Jr.申请了“Linux”商标,9月进行了注册。11月3日,Red Hat共同创始人Marc Ewing宣布可以以49.95美元的零售价格获得Red Hat Software Linux的CD-ROM和30天的安装支持。 +1994年3月14日,Linux内核V1.0发布,它支持基于i386单处理器的计算机系统。8月15日,William R. Della Croce, Jr.申请了“Linux”商标,9月进行了注册。11月3日,Red Hat共同创始人Marc Ewing宣布可以以49.95美元的零售价格获得Red Hat Software Linux的CD-ROM和30天的安装支持。 1996年5月9日,吉祥物Tux诞生。6月9日,Linux内核V2.0发布,这是第一个在单系统中支持多处理器的稳定内核版本。Linux从此成为很多公司的重要选择。10月14日,Mattias Ettrich发起KDE项目,此前UNIX和Linux都没有统一的桌面系统,编写桌面软件非常复杂。 @@ -126,8 +126,6 @@ Linux内核大版本的更新周期一般是2-3个月,当前最新版本为Lin - Rust基金会(2021年成立) - 天工开物开源基金会(2023年成立) - ~~查看各基金会的详细介绍请扫描右侧二维码。~~ - ## 1.3 中国开源发展简史 1991年,中国与AT&T Bell Laboratories USL/USG合作,引进UNIX SVR 4.2版本源代码(全球唯一,但属于“后UNIX”闭源时期),并发布了中文版本,合作组建了中国UNIX公司;中方同时也引进“前UNIX”开放的源代码。 @@ -166,7 +164,7 @@ Linux内核大版本的更新周期一般是2-3个月,当前最新版本为Lin 在这个阶段,部分中国开发者开始尝试向国际上游社区贡献代码。但同时,国内Linux企业对开源技术采用拿来主义,忽视开源社区、商业模式和开源知识产权等方面的投入和积累,导致在国际社区中出现了许多针对中国Linux发行商只是开源使用者的评价,直到2008年,这种印象才得以扭转。 -2004年,中国开源软件推进联盟成立,陆首群教授被推举为联盟主席,在陆首群主席的大力推进下,为推动开源在中国的发展而不懈努力,也启动了中国与日本、韩国以至全球在发展开源的方面国际合作。联盟的国际智囊团聘请了几十位全球顶级开源专家以多种形式参与和推进中国开源建设,如此规模的智囊团在全球首屈一指,是开源界公认的顶级智库。可以说,联盟的成立和陆主席的领导加速了中国开源软件发展的速度,为碎片化的国内开源产业建立了统一的根据地,为国际开源生态和中国开源生态建立了纽带。 +2004年,中国开源软件推进联盟成立,陆首群教授被推举为联盟主席。在陆首群主席的大力推进下,COPU 为推动中国开源软件的发展而不懈努力,也为促进中、日、韩乃至全球关于开源运动的沟通、交流、共享、协同与合作而努力,为促进中国、东北亚和全球开源运动作出贡献而努力。联盟的国际智囊团聘请了几十位全球顶级开源专家以多种形式参与和推进中国开源建设,如此规模的智囊团在全球首屈一指,是开源界公认的顶级智库。可以说,联盟的成立和陆主席的领导加速了中国开源软件发展的速度,为碎片化的国内开源产业建立了统一的根据地,为国际开源生态和中国开源生态建立了纽带。 2008年,以Kernel、Apache、GNOME、OpenOffice为代表的国际知名开源社区纷纷选择在北京召开全球技术峰会,作为他们进入亚洲的第一步(之前从未在亚洲国家召开顶级技术峰会)。这是对中国开发者在社区提交贡献的肯定。因此,我们认为2008年成了中国开源发展重要的分水岭。 @@ -180,7 +178,7 @@ Linux内核大版本的更新周期一般是2-3个月,当前最新版本为Lin ### 1.3.4 加速时代 -2019年至今,中国开源进入了一个新的时代一一加速阶段。 +2019年至今,中国开源进入了一个新的时代——加速阶段。 根据Linux基金会有关Kernel.org社区贡献的统计,来自中国开发者的贡献已居全世界之首(Kernel 4.14至今)。中国开源发展进入深水区,开源生态的完整性、开源社区的成熟性、开源商业模式的多样性和复合性都在发生巨大变化。 @@ -197,16 +195,12 @@ Linux内核大版本的更新周期一般是2-3个月,当前最新版本为Lin 软件知识产权是计算机软件人员对自己的研发成果依法享有的权利。目前国际上对软件知识产权的保护法律还不是很健全,大多数国家都是通过著作权法来保护软件知识产权的,与硬件相关密切的软件设计原理还可以申请专利保护。 - 软件知识产权主要包括著作权、专利权与商标权。 -- 著作权指软件的表达(如程序代码、文档等)方面的权利。 +- 著作权指软件的表达(如程序代码、文档等)方面的权利。 - 专利权包括软件的技术设计,如程序设计方案、处理问题的方法、各项有关技术信息等方面的权利。 - 商标权则是指软件的名称标识方面的权利。 软件需要有硬件平台的支撑才可以运行,而在硬件平台上运行的软件基本上是目标码(二进制格式),从而造成软件源码和二进制目标码的分离和割裂,而软件作为通用商品进行销售或分发时主要提供的只是二进制文件,这也成为主流的软件销售和分发方式,并主要通过随软件一起发布的最终用户许可协议(End User License Agreement,EULA)对软件的使用、修改和分享及其他相关事宜作出规定。 - ~~EULA指的是一家公司的软件与软件的使用者所达成的协议,是软件应用程序作者或者发布者与应用程序使用者之间的合法合同。~~ - - ~~EULA一般主要规定用户不可以盗版软件,并没有对用户明确涉及对应软件源代码的处置问题——除非特定情况,销售的二进制形式的软件并不提供对应软件源代码;即使偶有提供,但对用户基于该源代码的复制、修改和二次分发等作了严格限制或者禁止。~~ - 针对上述对软件源代码的处置方式,出现了一种开放、协同、共享的软件发展模式——通过开源软件许可证对软件源代码的复制、修改、再分发等权益,对商标、专利、著作权等内容进行进一步规范,这也是对软件知识产权发展的一个重要补充。 ### 1.4.2 开源软件许可证 @@ -282,7 +276,7 @@ Apache许可证是一种“宽松”(Permissive)的许可证,目前常用 ### 1.4.4 木兰开源许可证解读 -木兰许可证族由中国电子标准化研究院牵头研制,已发布版本包含木兰宽松许可证(MulanPSL v1;MulanPSL v2)、木兰公共许可证(MulanPubL v1;MulanPubL v2)、木兰-白玉兰开放数据许可协议(MBODL v1)、木兰开放作品许可协议(MulanOWLs v1)。 +木兰许可证族由中国电子标准化研究院牵头研制,已发布版本包含木兰宽松许可证(MulanPSL v1;MulanPSL v2)、木兰公共许可证(MulanPubL v1;MulanPubL v2)、木兰—白玉兰开放数据许可协议(MBODL v1)、木兰开放作品许可协议(MulanOWLs v1)。 #### 1.4.4.1 木兰宽松许可证(MulanPSL) @@ -302,11 +296,11 @@ MulanPSL v2于2020年通过OSI认证,是全球首个由我国主导的国际 木兰公共许可证与国外主流许可证对分发的限制 -#### 1.4.4.3 木兰-白玉兰开放数据许可协议 +#### 1.4.4.3 木兰—白玉兰开放数据许可协议 -木兰-白玉兰开放数据许可协议于2021年7月在世界人工智能大会发布第一版,旨在基于中国国情和法律,针对人工智能场景下的数据使用与非商业约束做了分层详实约定,从而最大限度鼓励和助力关键数据资源的开放流通。 +木兰—白玉兰开放数据许可协议于2021年7月在世界人工智能大会发布第一版,旨在基于中国国情和法律,针对人工智能场景下的数据使用与非商业约束做了分层详实约定,从而最大限度鼓励和助力关键数据资源的开放流通。 -数据要素的流通是一个复杂问题,其牵涉到技术、商业模式、法律环境等多个维度的问题,而“木兰-白玉兰协议”的目的是希望从法律层面提供一套可以约定数据发布方和使用方的标准权责的文本,从而形成一种“社区行为规范”去加速数据的开放共享。 +数据要素的流通是一个复杂问题,其牵涉到技术、商业模式、法律环境等多个维度的问题,而“木兰—白玉兰协议”的目的是希望从法律层面提供一套可以约定数据发布方和使用方的标准权责的文本,从而形成一种“社区行为规范”去加速数据的开放共享。 考虑到数据要素流通的合规复杂性,MBODL v1基于以下原则和适用性拟定: @@ -315,9 +309,9 @@ MulanPSL v2于2020年通过OSI认证,是全球首个由我国主导的国际 - 所发布数据符合国家数据安全的要求,不涉及国家秘密、国家安全、社会公共利益、商业秘密等。 - 所发布数据当前不涉及个人信息。 -基于当前人工智能训练数据集从权属角度可分为两类情况:第一类,数据由数据发布者合法合规所有或具备用益权;第二类,数据由数据发布者通过合法合规的方式自第三方处获取汇编组合而得。因此MBODL对上述两类情况产出了两组不同起草策略的协议: +基于当前人工智能训练数据集从权属角度可分为两类情况:第一类,数据由数据发布者合法合规所有或具备用益权;第二类,数据由数据发布者通过合法合规的方式自第三方处获取汇编组合而得。因此,MBODL对上述两类情况产出了两组不同起草策略的协议: -第一种,MBODL自主拥有数据或拥有处置权。在协议架构上,设置了类似CC协议的一个套组协议: +(1)MBODL自主拥有数据或拥有处置权。在协议架构上,设置了类似CC协议的一个套组协议: - MBODL-SA:相同方式授权,使MBODL具备传染性。 - MBODL-NC:非商业,可匹配不同非商业限定。 @@ -325,7 +319,7 @@ MulanPSL v2于2020年通过OSI认证,是全球首个由我国主导的国际 以上协议均以MBODL基础,在“许可限制”小节中予以增加不同的限制而形成,同时也类似CC协议,可以再进行许可限制的叠加交叉,形成新的协议。 -第二种,汇编第三方内容形成数据集。类似Open Database License(ODbL),采用“数据集结构和数据集内容分离”策略。对数据库或者数据集的结构(即数据选取、组织的方式,database scheme)和数据内容予以了拆分授权的方式。目前,MBODL(结构内容分离版)协议作为一个单独的实验性协议供各界讨论适用性和条款的实践落地可能。 +(2)汇编第三方内容形成数据集。类似Open Database License(ODbL),采用“数据集结构和数据集内容分离”策略。对数据库或者数据集的结构(即数据选取、组织的方式,database scheme)和数据内容予以了拆分授权的方式。目前,MBODL(结构内容分离版)协议作为一个单独的实验性协议供各界讨论适用性和条款的实践落地可能。 MBODL协议突破了以往数据协议中对“使用”一词的模糊定义,将传统的“使用”一词,依照数据分析和机器学习的术语,做技术性分解和定义,便于行业内技术人员理解协议的制约。同时破局“非商业”的模糊性,对数据本身商业化、模型商业化、基于分析和模型的结论商业化做明确的独立切割。并且明确限制的类型和范畴。 @@ -361,16 +355,10 @@ MBODL协议突破了以往数据协议中对“使用”一词的模糊定义, 开源作为标准化对象。标准化对象是指需要标准化的主题。通常,标准化对象包括两方面的内容:一是标准化学的研究对象,二是标准化工作的对象。前者也称为总体对象,它是各工作对象的总和构成的总体,主要是研究各种具体对象的共同属性、本质和普遍规律;后者也称为具体对象,它是需要制定标准的对象或各专业标准化工作的对象。 - ~~研究对象和工作对象是一般与具体的关系,是共性与个性的关系。不能没有工作对象,也不能没有研究对象,工作对象是研究对象的基础,研究对象则是工作对象的指南。由于研究对象从宏观角度出发,研究事物的共性,更适合制定为国家标准。~~ - - ~~作为研究对象的开源规则和社区治理部分因其关注本质、基础共性理论和普遍规律等层面的研究,应当从国家标准层面制定标准;作为工作对象的开源项目和技术部分因其关注技术架构、接口定义与互联互通等层面的研究,可以制定为团体标准。~~ - **规范与实现的关系** 标准是技术的抽象规范,开源则是以“开源方式”对于标准所定义规范的具体实现。 - ~~标准的实现方式不仅限于开源实现,还可以通过“闭源”方式实现。~~ - **协同发展的关系** 标准是基于开放流程的、以实现兼容性和互操作为目标的技术规范的开发过程。开源是基于开放合作和代码共享为特征的技术实现过程。开源与标准是构建开放的信息技术生态的两种重要工具,两者相互补充,相互促进,协同发展,缺一不可。 @@ -429,10 +417,6 @@ MBODL协议突破了以往数据协议中对“使用”一词的模糊定义, 在开源标准制定过程中,将关注如何计算、评估以及测量各种指标,如一个GitHub仓库中可以看到的stars数量、其数量背后的价值、开源项目的热门程度、技术难度、质量高低、社区健康度等指标。同时基于开源标准构建评估体系,更好服务开源生态建设。 - ~~(5)整理最佳实践~~ - - ~~建设评估体系和整理最佳实践是当前构建良好开源治理体系、可持续健康运营开源社区的两个有力抓手,应相互兼顾,互相补充,以实现最优。例如ISO 9000标准是质量管理领域的最佳实践总结。~~ - 当前开源发展过程中,以标准体系化方式汇集最佳实践,并不断修订以帮助开源社区健康成长,是开源标准化工作重点关注的方向之一。 #### 1.5.1.4 标准开源化价值 @@ -469,221 +453,17 @@ MBODL协议突破了以往数据协议中对“使用”一词的模糊定义, #### 1.5.2.1 开源的标准化需求 -一是开源规则和社区治理的标准化。 +(1)开源规则和社区治理的标准化。 开源要素包括术语、概念和规则等需要通过标准化达成共识,否则会埋下混淆的隐患。目前开源的一些重要要素由“开放源代码促进会”(Open Source Initiative,OSI)定义,符合其发布的“开源定义”(Open Source Definition,OSD)已经成为业界广泛应用的、用于确定“开源许可证”的标准;在OSD的基础上OSI发布的“开源许可证”在业界应用广泛;同时,OSI还建立了许可证审查流程,“确保标记为开源的许可证和软件符合现有的社区规范和期望”。OSI标准在开源领域内达成了共识,防止开源的滥用。 - ~~开源要素的标准化需求还体现在其他很多方面,例如开源知识产权方面以及金融行业为保障开源软件的安全应用在国家标准层面开展研制等。~~ - -二是开源项目和技术的标准化。 +(2)开源项目和技术的标准化。 大量开源社区建设标准化流程,围绕开源项目和技术制定团体标准,并基于团体标准推动国际标准的制定。 -例如,Linux Foundation建立了标准化组织Joint Development Foundation(JDF),2020年经ISO/IEC JTC1批准,成为公开可用规范(PAS)提交者;Eclipse Foundation设立Eclipse Foundation Specification Process,“为制定开源社区驱动的、开源友好的规范提供开放和透明的框架”;OpenInfra Foundation为OpenStack技术品牌的定义成立了DefCore标准项目,用于“确定如何授予OpenStack的商业实施使用商标的指导原则”。 +例如,Linux Foundation建立了标准化组织Joint Development Foundation(JDF),2020年经ISO/IEC JTC1批准,成为公开可用规范(PAS)提交者;Eclipse Foundation设立Eclipse Foundation Specification Process,“为制定开源社区驱动的、开源友好的规范提供开放和透明的框架”;OpenInfra Foundation为OpenStack技术品牌的定义成立了DefCore标准项目,用于“确定如何授予OpenStack的商业实施使用商标的指导原则”。 #### 1.5.2.2 标准的开源化需求 标准化组织建设开源项目,围绕标准的验证、实施和推广开发开源代码。 -例如,万维网联盟(World Wide Web Consortium,W3C)建立开源项目W3C Open Source Software, 认为“W3C标准的自然补充是可运行的代码,实现和测试是标准开发的重要组成部分,发布代码促进了开发人员社区的思想交流”;结构化信息标准促进组织(Organization for the Advancement of Structured Information Standards,OASIS)建立开源项目Open Projects,支持社区“在开源许可证下开发所需技术——代码、API、标准、参考实现”;致力于Java语言标准开发的Java Community Process标准组织建设OpenJDK开源社区,“为JavaSE JSRs标准提供开源参考实现”。 - -### ~~1.5.3 开源与标准协同发展的挑战与机遇~~ - -~~开源与标准协同发展的过程中既有挑战也有机遇,推进开源与标准的协同发展既要制定策略迎接挑战,解决问题,同时也要抓住机遇,推进发展。在新发展趋势下,OSD对于开源的定义已显露其局限性。~~ - -#### ~~1.5.3.1 挑战~~ - -~~开源社区的标准化不足问题~~ - -1. ~~在开源规则和社区治理领域的标准化不足~~ - -~~一是当前整个开源领域里的各种概念不明晰。如开源、开源软件、开源硬件、开源社区、开源产品、开源基金会等定义,不能简单的从OSD进一步推理得出。定义的模糊会增加政策制定的困难,从而导致开源软件、开源开发者等要素间界面的模糊不清。~~ - -~~二是当前相关标准的制定过程较为零散。开源标准的研制过程中有些为公开进行,有些仍在企业内部孵化酝酿阶段,可以预期在未来很长一段时期,开源标准将会层出不穷。~~ - -~~三是当前大量开源领域人士更愿意凭“事实标准”说话。结果将导致,标准往往只能事后追认业界的主流形态,无法起到凝聚共识,引领创新的作用。~~ - -~~在开源规则和社区治理领域的标准化不足带来的问题包括开源社区的质量和安全挑战等等。~~ - -- ~~质量挑战。随着开源软件数量的增长越来越快,开源社区的治理无法支持高质量管理,大量开源项目的质量将会缺乏保障。建立开源软件的质量管理标准将是提高社区治理能力的重要工具。~~ - -- ~~安全挑战。随着开源软件应用越来越广泛,其出现安全漏洞时可能造成的风险与损失也会越来越大。例如之前爆发的OpenSSL心脏滴血漏洞与大规模Log4j2漏洞。面对当前国内外开源领域可能产生的安全风险,需要从生态层面系统性的加以解决,应当以标准为抓手针对开源项目安全风险进行防范,以创造更好的开源生态环境。~~ - -2. ~~在开源技术领域以代码作为“标准”~~ - -~~开源社区对于标准化的价值理解不足,通常会简单认为可以以代码作为“标准”。~~ - -~~开源通过开放式的代码开发和共享迅速推动技术的广泛应用,在达到一定应用规模和影响力后,可以完成一部分“标准”的功能,例如支持系统之间的互操作。但是必须注意到这种互操作仅通过源代码实现的,只能保证采用这套源码的系统之间的互操作,而对于与其它的竞争开源项目、竞争私有系统以及同一生态体系的其他系统之间的互操作是无法保证的;而且,利用代码实现标准的过程一般由于缺乏开放、公开、透明的流程支撑,导致生态发展缺乏开放性,也为未来产业生态的持续健康发展带来危机。~~ - -~~因此,以代码作为“标准”,在实现“标准”的价值方面是极其有限的。而标准化可以在更广泛的范围内实现互操作,在更高的抽象级别定义互操作需求,通过接口实现互操作,而不仅仅提供源代码实现。~~ - -- ~~标准化组织对于开源的价值认识尚需提高~~ - -~~一些传统的标准化组织对于开源在标准化工作中的重要性认识不足,仍然坚持以传统的方式制定技术和技术类标准,不能借助开源实现的契机提高标准质量,推动标准应用,这些组织可能会在竞争中受到较大挑战。~~ - -- ~~标准中的知识产权问题是与开源协同过程中的重大挑战~~ - -~~传统的标准组织都是以Free Reasonable and Non-Discriminatory(FRAND)实施标准中的专利授权,而这种授权模式无法支持开源的商业模式。一些标准组织,例如W3C,为了支持开源模式制定了Royalty Free的专利处置规则,很好的促进的开源的标准实现和应用。~~ - -~~一些开源组织也无法避免在代码实施标准的过程中,由于标准中知识产权的处置问题而无法实现某些标准,严重的阻碍了开源代码的开发与推广。开源组织已经开始采取措施应对这一挑战,例如Linux Foundation与Open Innovation Network合作,期望通过专利池的管理来保障标准实施过程中不受知识产权的影响。~~ -~~解决标准中的知识产权问题是促进开源与标准系统发展的重要制度性挑战。~~ - -#### ~~1.5.3.2 机遇~~ - -~~当前国际开源领域的发展也为我国带来重大机遇,一是我国应积极参与、甚至主动引领某些开源标准的制定工作,在国际领域贡献我国对于开源的看法,成为全球开源生态更加有力的领导者和协作者;二是改变开源领域事后追认的标准形式,并进一步探索柔性、可组合和前瞻性的标准,为我国将来的开源竞争力打下坚实基础。~~ - -- ~~开源规则和社区治理标准化的机遇~~ - -~~开源源自软件开发,意指开放源代码,最初指一种开放共享软件代码的开发模式。OSI对开源软件进行了定义,符合其发布的OSD即为开源软件,是目前国内外较公认的、权威的开源定义。但是OSD的本质是定义了开源软件授权协议的主要特征,并非定义了开源本身。作为一种“事实标准”,业界通常认为:采用了符合OSD的授权协议的软件,就是开源软件;也有观点认为:只要放在GitHub上的,就是开源软件。在开源发展的过程中以上观点已逐渐显露其局限性,均亟待完善与补充。~~ - -1. ~~开源内涵与外延~~ - -~~开源本质上是一种开发模式,开源最初的内涵和外延都是围绕软件代码开发,范围主要在软件层面,但随着开源模式在各技术领域和行业的逐渐发展,其内涵和外延已发生变化,除软件领域,开源的模式和精神已延伸至硬件、数据、信息共享、开源文档、开源情报等方面。同时OSI对于开源的定义只涉及开源软件,不能满足现有开源发展的涵盖领域,需要对其进行补充,基于此需求,国内开源产学研用各界以标准化语言体系为基础,分析凝练开源本质和关键特征,在OSD基础上提出开源的新定义:~~ - -~~开源是一种在软硬件开发、数据与信息共享中广泛采用的开放式协作模式,协作的产出物应该符合开源许可证条款的要求。具有开源规则、开源对象、参与主体、开源基础设施四个基本要素。~~ - -2. ~~开源生态四要素~~ - -~~![](https://img-blog.csdnimg.cn/f71b0ebd47494729af9c797735e883a5.png)~~ - -~~图 开源生态四要素~~ - -~~(1)开源规则~~ - -~~开源规则是维持开源世界运转的基石,包括但不限于开源许可证、开源运营治理规则和应用评价规则等。较为人知的显性开源规则是开源许可证。开源许可证本质上是“非标准”的授权合同文本,规定了企业或开发者基于共同遵守的一类或几类代码分发、应用和知识产权许可条款,共同开发和使用开源软硬件源代码、数据和信息等,遇到纠纷需经法院判决才能生效。~~ - -~~除开源许可证之外,开源运营治理规则和应用评价规则是长期存在于开源世界,对于开源应用和生态发展至关重要的隐性规则,是各方从事开源实践时所遵从的一套方法论。~~ - -~~(2)开源对象~~ - -~~开源对象是开源群智化创新的内核。开源对象,包含开源代码、以及构建于开源代码之上的开源项目。目前,开源的内涵和外延已大大扩展,开源对象已延伸至硬件、数据信息等方面,可概括为开源软件、开源硬件、开放数据集、开放文档等类型。此外,开源对象的外延也发生变化,从技术层面向其他层面发散,涌现出开放科学、开源经济、现代服务业等。~~ - -~~对开源对象这一部分的研究工作还在持续进行中,将会随着开源在中国的不断发展而越来越清晰、成熟和丰富。~~ - -~~(3)参与主体~~ - -~~开源参与主体是推进开源不断向前发展的源动力,包括但不限于贡献者(个人/企业)、使用者(最终用户)、运营者(组织者/管理者)、和合作者(法律/监管)。开源生态系统汇聚了企业、开发者、开源基金会、开源社区、政府、科研院校等众多参与主体, 持续吸纳来自全球各界的贡献,具有极快的发展速度和极大的创新潜力。开源生态的发展还与国家政策的倾向有密切关系。我国开源参与主体存量大,近几年一直持续增长,未来在主导技术、引领创新和培育生态等方面具备较突出的后发优势。~~ - -~~(4)开源基础设施~~ - -~~开源基础设施是开展活动的载体,是指以服务开源项目、开源社区、开源生态为目标提供的软、硬件类平台、工具和服务。最常见的是开源代码托管平台,主要用于代码开发、管理、交流、修改、以及提出新开发需求等,覆盖开源软件生产全生命周期,开源基础设施还包括用于技术开发、社区交流、开发者汇聚、宣传推广等的邮件列表和问题追踪系统等。~~ - -~~开源基础设施是开源要素的汇聚承载枢纽。开源基础设施建设水平的高低,一定程度上会影响开源对象发展速度、参与主体使用黏性和开源生态的汇聚建设等,也是目前我国在发展开源过程中正在发力建设的重要因素。~~ - -- ~~开源项目技术标准化的机遇~~ - -~~利用标准化支撑开源项目的可持续发展以及开源技术生态的建设在业界已经有了丰富的实践,标准化对于开源项目的价值也逐步得到更多重视,应当抓住这个机遇大力推进开源项目的技术标准化。~~ - -- ~~标准化组织建设开源项目的机遇~~ - -~~标准化组织中建设开源项目已经成为业界领先的标准化组织的基本形式。随着我国国家标准化纲要的推进,借助团体标准化发展的契机以及大力推进标准实施的战略要求,在标准化组织中建设开源项目也将成为提升标准化能力的重要手段。~~ -  - -## ~~1.6 开放科学和开放获取~~ - -### ~~1.6.1 开放科学的发展历程~~ - -~~开放科学的思想最早萌芽于中世纪的欧洲宫廷资助系统,资助者采用同行评议、开放交流的方式鉴别受资助成果的质量。开放科学的发展大致经历了三个阶段。欧洲一直走在开放科学的前沿,2009年欧盟第七框架计划(FP7)资助了欧洲科研开放获取基础设施项目OpenAire,致力于建设开放和可持续的学术交流基础设施。2014年,在欧洲“地平线2020计划”下提出了欧洲开放科学培训项目(FOSTER)。2018年,欧盟支持发起开放获取S计划,旨在使得受公共和私人支持的,经过同行评议的出版物能够完全和立即开放获取 。美国开放科学中心(COS)于2013年发布了开放科学框架(OSF),旨在协助科研团队管理项目和公开成果 。《中华人民共和国科学技术进步法》(2021年修订)第九十五条规定“推动开放科学的发展,促进科学技术交流和传播”。~~ - -### ~~1.6.2 开放科学概念和框架~~ - -~~![](https://img-blog.csdnimg.cn/a235a17ce1b4424a8cef3f0eb9e6bdd7.png)~~ - -~~根据联合国教科文组织(UNESCO)在2021年11月发布的《开放科学建议书》,开放科学被定义为一种包容性的结构,它结合了各种运动和实践,旨在使多语言科学知识对所有人开放、可访问和可重复使用,以增加科学合作和信息共享,以造福于科学与社会,并向传统科学界之外的社会行为者开放科学知识创造、评估和交流的过程。开放科学包括所有科学学科和学术实践的各个方面,包括基础科学和应用科学、自然科学和社会科学以及人文科学,它建立在开放科学知识、开放科学基础设施、科学传播、社会行为者的开放参与并与其他知识系统进行公开对话的框架之上。~~ - -### ~~1.6.3 开放科学的核心价值观、指导原则、行动领域和监测~~ - -~~《开放科学建议书》概述了开放科学的四大核心价值观、六项指导原则、七个行动领域。~~ - -#### ~~1.6.3.1 开放科学的核心价值~~ - -~~(1)质量和完整性:开放科学应该尊重学术自由和人权,支持高质量的研究,方法是汇集多种知识来源,广泛提供研究方法和成果,供严格审查和透明的评估过程使用。~~ - -~~(2)集体利益:科学知识应该是公开且普遍共享的。科学实践应该是包容的、可持续的和公平的,也应该是科学教育和能力发展的机会。~~ - -~~(3)公平公正:开放科学应发挥重要作用,确保发达国家和发展中国家科学家之间的公平,实现科学投入和产出的公平互惠共享,使知识的生产者和消费者都能平等获得科学知识。~~ - -~~(4)多样化与包容性:开放科学应该包含知识、实践、工作流程、语言、研究成果和研究主题的多样性,以支持科学界作为一个整体的需求和知识多元化,支持多样化的研究团体和学者,支持传统科学界之外的更广泛的公众和知识持有者,包括土著人民和当地社区,以及不同国家和地区的社会行动者。~~ - -#### ~~1.6.3.2 开放科学的指导原则~~ - -~~(1)透明度、审查、批评和可重复性:应该在科学努力的所有阶段促进增加开放,以加强科学成果的强度和严谨性,增强科学的社会影响,并提高整个社会解决复杂的相互关联的问题的能力。~~ - -~~(2)机会均等:所有科学家和其他开放科学行为者和利益攸关方都有平等的机会接触开放科学,为开放科学作出贡献并从开放科学中受益。~~ - -~~(3)责任、尊重和问责:与公共问责、对利益冲突的敏感、对研究活动可能产生的社会和生态后果的警惕、知识产权和对与研究有关的伦理原则和影响的尊重一起,应该构成开放科学良好治理的基础。~~ - -~~(4)合作、参与和包容:超越地理、语言、世代和资源界限的各级科学进程的合作应成为规范,学科之间的合作应得到促进,社会行为体的充分和有效参与,并吸收边缘社区的知识,以解决具有社会重要性的问题。~~ - -~~(5)灵活性:鼓励向开放科学过渡和实践的不同途径,同时坚持上述核心价值,并最大限度地遵守在此提出的其他原则。~~ - -~~(6)持续性:开放科学应该建立在长期实践、服务、基础设施和资助模式的基础上,以确保来自弱势机构和国家的科学生产者的平等参与。~~ - -#### ~~1.6.3.3 开放科学的行动领域~~ - -~~为实现开放科学建议书的目标,建议成员国根据国际法并考虑到各自的政治、行政和法律框架,在以下七个领域同时采取行动。~~ - -~~(1)促进对开放科学、相关利益和挑战以及开放科学的多种途径的共同理解;~~ - -~~(2)为开放科学营造有利的政策环境;~~ - -~~(3)投资开放科学基础设施和服务;~~ - -~~(4)投资于开放科学的人力资源、培训、教育、数字素养和能力建设;~~ - -~~(5)培育开放科学文化,调整开放科学激励机制;~~ - -~~(6)在科学进程的不同阶段促进开放科学的创新方法;~~ - -~~(7)在开放科学的背景下促进国际和多方利益攸关方合作,以减少数字、技术和知识差距。~~ - -#### ~~1.6.3.4 开放科学的监测~~ - -~~(1)部署监测和评估机制,以衡量开放科学政策和激励措施对既定目标的有效性和效率。采用多方利益攸关方的方法,收集和传播开放科学及其影响方面的进展、良好做法、创新和研究报告。~~ - -~~(2)制定监测指标和框架,考虑在国家战略计划范围内制定一个具有质量和数量指标并在国际一级共享的监测框架,为执行本建议制定短期、中期和长期的目标和行动。~~ - -~~(3)制定战略以监测开放科学的有效性和长期效率,其中包括多方利益攸关方的参与方法。~~ - -### ~~1.6.2 开放获取~~ - -#### ~~1.6.2.1 开放获取的发展历程~~ - -~~2002年,《布达佩斯开放获取倡议》(BOAI)正式提出开放获取概念 。2003年,德国马普学会等机构发起开放获取柏林会议,并发表《柏林宣言》,呼吁免费公开更多的科学资源,鼓励科学家以OA方式出版论文 。2004年,Springer出版集团开始在其1000多种订阅期刊上向作者提供开放获取选项,带动期刊向符合开放获取期刊转换。2006年,高能物理开放获取联盟SCOAP3建立,推动学科内大多数期刊向开放获取出版转换 。2007年,南非开普敦开放教育会议发布了《开普敦开放教育宣言》 。2009年,开放获取知识库联盟COAR成立,旨在联合遍布五大洲的机构知识库并建立一个全球协作网络,提高存储成果的可见度和利用度。2013年,全球研究理事会发布《出版物开放获取行动计划》。~~ - -#### ~~1.6.2.2 开放获取的主要方式~~ - -~~《布达佩斯开放获取倡议》提出了实现开放获取的两条路径,即开放获取期刊(Open-access Journals)和开放存储(Self-archiving),这两种方式分别被称为金色OA和绿色OA。除这两种主要方式外,在实际出版过程中还有其他的开放获取模式。~~ - -~~金色OA(Gold OA):指论文的最终版本在网络上立即开放获取,读者不需要付费。金色OA的论文一般发表在完全开放获取或向开放获取转换的期刊上,遵循CC BY或CC BY-NC-ND的版权许可协议,由作者、研究机构或基金资助机构缴纳论文处理费(article processing charge,APC) 。~~ - -~~绿色OA(Green OA):指作者在订购期刊上发表论文后, 将论文一定版本存到开放获取知识库中并在一定时间后(Embargo period, 开放时滞期)开放获取 。~~ - -~~青铜OA(Bronze OA):指科研论文的许可并不明确,出版商可能限时授予文献免费访问权限的获取方式 。~~ - -~~钻石OA(Diamond OA):指在不收取作者费用的情况下,发布开放获取的期刊,即作者和读者双向免费。2022年3月2日,Science Europe、S联盟(cOAlition S)、人文学科开放学术交流研究基础设施服务联盟项目(OPERAS)和法国国家研究机构(ANR)共同提出了“钻石OA行动计划” 。~~ - -~~黑色OA(Black OA):是较新的说法,指的是从学术社交网(如Mendeley、Research Gate、Academia.edu等)或非法提供学术论文全文的网站(如Sci-Hub)上可以免费下载大量本应交费浏览的学术文章 。~~ - -#### ~~1.6.2.3 开放获取的载体~~ - -~~CORE(https://core.ac.uk/)是全球最大的开放获取研究论文库,其使命是索引全球所有开放获取研究,并为所有人提供不受限制的访问。CORE目前包含2.61亿篇从全球11,000数据提供商收集的开放获取文章。~~ - -~~Dimensions是最全面的研究资助数据库,它将资助与数百万种由此产生的出版物、临床试验和专利联系起来。截至2023年5月Dimensions有135,517,255出版物、6,595,673基金、12,245,864数据集、938,422政策文本、770,634临床试验、153,152,401项专利 。其中,开放获取论文共有42,747,022,约占31.5%。该平台收录的中国出版物总量为4,203,610、数据集为405,693、基金项目619,635、临床试验10,249,其中开放获取论文共1,265,665,占比30.11%。~~ - -~~Web of Science(https://www.webofscience.com/wos)是全球最受信赖且独立于出版方的全球引文数据库。平台全面收录了超过 17 亿条被引文献和 1.59 亿条记录,可以跟踪跨学科和时间的科研想法。截至2023年5月,Web of Science核心合集中收录的中国论文共有7,776,949篇,其中开放获取论文2,195,823篇,占28.23%。~~ - -- ~~开放获取期刊~~ - -~~开放获取期刊指用户可以在法律允许的范围内最大限度地接近学术资源,打破传统学术期刊的限制和门槛,排除经济、地域等因素,按照个体需求进行阅读和分享学术期刊 。开放获取期刊强调自由、免费、开放、共享的理念,减少了获取学术信息的阻碍和交流的时滞性,为快速传播科研成果提供了有利条件。美国科研出版社(Scientific Research Publishing,简称SCIRP)是全球最大的开放获取期刊出版商之一。目前已出版超过200多种开放获取、在线、同行评审的期刊,涵盖了广泛的学术学科。此外,国际上开放出版期刊平台还有PLOS、Cogent OA 、Dove Medical Press 、Copernicus Publications 、ELCVIA 、Frontiers 等。DOAJ是全球开放获取期刊索引,只接受开放获取期刊,期刊应遵守学术出版的透明度和最佳实践原则,期刊必须有自己的专用URL和主页,必须至少有一个ISSN,期刊必须有编辑和编委会,所有文章在发表前必须通过同行评审 。截至2023年4月,DOAJ共收录来自131个国家的19,233种期刊,其中中国期刊有256种,占1.33% 。GoOA是开放获取论文一站式发现平台,是由中国科学院资助、中科院文献情报中心建设推出的开放资源。它收录了经严格遴选的来自144家知名出版社的2500余种OA期刊及其全文,学科领域涉及自然科学领域及部分社会科学领域。~~ - -- ~~机构知识库~~ - -~~机构知识库(Institutional Repository,简称IR)又称机构典藏库、机构仓储、机构库等,通常情况下指的是,某个机构实体为保存和管理本机构智力成果资源(包括本机构成员创作的学术成果、科研数据、课件教程、软件工具等),自主或借助第三方机构建立的集提交、组织、检索、分析、利用等为一体的学术存储与服务系统 。OpenDOAR是开放获取存储库全球目录,截至2023年4月,OpenDOAR平台注册的机构知识库总数达6025个,其中美国(925个)、日本(657个)、英国(324个)排名前三位,中国65个,占比1.08% 。2019年4月4日在美国宾夕法尼亚州费城举行的RDA第十三届全体会议上提出了维护数字存储库可信性的TRUST原则,即Transparency(透明度)、Responsibility(承担责任)、User Focus(用户导向)、Sustainability(可持续性)、Technology(技术能力)。国际上机构知识库联盟主要包括:开放获取知识库联盟(COAR)、法国FAL、荷兰DAREnet、澳大利亚ARROW、日本JAIRO、德国OA-Network、英国JISC RepositoryNet、欧盟DRIVER 。我国的机构知识库联盟主要有中国科学院机构知识库网络(CAS IR GRID)、中国高校机构知识库联盟(Confederation of China Academic Institutional Repository,简称 CHAIR)和农业机构知识库联盟。其中,CAS IR GRID共有期刊论文908,684篇,会议论文139,822篇,专利数据114,490条,其他数据132,784条 。CHAIR共有会员机构51家,元数据总量2,868,428,访问量248,935 。农业机构知识库联盟共有下属机构36个,专家学者7514位,科研成果197,697篇 。~~ - -- ~~预印本平台~~ - -~~预印本(preprint)是作者在提交期刊出版前未经严格同行评议的手稿(投稿版、录用稿),经过初步的评议审核后,即借助于预印本平台在最短的时间内以开放获取的形式发布,为作者获得最新研究成果的网络首发权,为学术交流系统提供最新、最快速的研究成果传播与利用渠道。~~ - -~~1961—1967年,在美国国立卫生研究院(NIH)的支持下,由相同领域或共同研究兴趣的科学家组成了“信息交换小组”(Information Exchange Groups,IEGs),该小组吸引了3600名研究人员并产生了2500篇预印本。第一个电子化预印本平台arXiv由物理学家保罗·金斯帕(Paul Ginsparg)于1991年在美国洛斯阿拉莫斯(Los Alamos)国家实验室建立,arXiv 起初主要收录高能物理领域的预印本,如今,学科领域扩展到数学、计算机、计量生物、计量金融、统计学等。2013年,美国开放科学中心 (Center for Open Science)推出了免费、开源的预印 本集成平台OSF(Open Science Framwork),目前平台数量达到30个,预印本及其由作者保存在预印本平台上的文献达220万篇。2017年Science将预印本评为当年十大科技进展之一,生物学bioRxiv和化学Chemrxiv在更大范围内受到关注。~~ - -~~学术论文出版的预印本平台有:arXiv、BioRxiv、medRxiv、ChemRxiv、F1000、figshare、Peerage of Science、engrXiv、PeerJ Preprints等 。其中,arXiv于1991年发起,涉及物理学、数学、计算机科学、定量生物学、定量金融学、统计学、电气工程和系统科学以及经济学领域的超过200万篇学术论文。BioXiv、MedXiv和ChemXiv分别是生命科学、医学和化学领域的预印本平台。ChinaXiv是中国科学院文献情报中心于2016年开始运营的预印本交流平台,支持中英文科技论文预印本的发布、传播、下载和评论。ChinaXiv还有面向具体学科领域的12个共建子平台,如中国心理学、生物工程、岩土力学、语音乐律、数学、天文学、光学、核物理、信息资源管理、护理学、法学和数字出版预印本平台。ChinaXiv-Global是由ChinaXiv提供的全球预印本服务,索引由全球重要的预印本平台发布的论文,帮助科研人员更好更快第发现最新的研究产出。~~ +例如,万维网联盟(World Wide Web Consortium,W3C)建立开源项目W3C Open Source Software,认为“W3C标准的自然补充是可运行的代码,实现和测试是标准开发的重要组成部分,发布代码促进了开发人员社区的思想交流”;结构化信息标准促进组织(Organization for the Advancement of Structured Information Standards,OASIS)建立开源项目Open Projects,支持社区“在开源许可证下开发所需技术——代码、API、标准、参考实现”;致力于Java语言标准开发的Java Community Process标准组织建设OpenJDK开源社区,“为JavaSE JSRs标准提供开源参考实现”。 -- GitLab