什么是公平的数据原则?

公平的数据原则是制定的洛伦兹中心2014年1月的研讨会根据现在描述的原则,在来自莱顿大学的一页上。他们是培养力量11.自然科学数据中正式出版2016年。

公平代表可找到的,可访问,可互操作和可重复使用的


CCDC博览会如何?

公平数据原则有助于指导我们的所有数据决策。CCDC制定公平数据原则的方式包括:

  • 确保机器能够使用标准格式和词汇可靠地理解晶体学实验、数据和知识。
  • 采用持久标识符来识别数据集及其贡献者。
  • 利用标准标识符,例如英寸,将数据集链接到一系列化学资源。
  • 通过机器可以获得确保元数据以实现与其他信息资源的互操作性。
  • 提供可搜索的资源,通过为人和机器设计的接口来发现数据。

剑桥结构数据库是如何实现FAIR的?

剑桥结构数据库(CSD)的结构和设计是我们FAIR活动的核心。特别是:

  • 它能够通过人类和机器发现和重用历史晶体信息。
  • 它允许从这些信息派生并应用于域的知识。
  • 通过各种Web和桌面工具,人类可以访问它。
  • 通过CSD Python API可以访问计算机。

为什么采取公平的数据原则?

分析生命和物理科学中越来越多的数据已经提出了艰巨的任务,每天的数据量增加了更大,更多样化。此外,人工智能和机器学习举措需要高质量的机器可读数据,也是在语义上连接的。遵守公平的数据原则有助于确保您的数据:

  • 支持全球下一代研究。
  • 适用于机器学习(ML)和人工智能(AI)模型。
  • 在您组织的所有级别仍然有序和可访问。
  • 可以支持过去的工作,节省时间和资源的迭代学习。

公平对待人类和机器

公平的数据原理强调了对人类和机器的数据的可取性,可访问性,互操作性和可重用性。今天的ML和AI技术需要通过机器有意义和准确地解释的数据。满足公平数据原则中列出的标准的数据集更有可能满足此类要求,并完全准备好。

知识图表:CCDC的Biochem图项目

我们在CCDC仍然致力于根据公平数据原则不断改进我们的数据。2020年7月,我们开始与欧洲蛋白质数据库(PDBe)和chembl(均位于欧洲生物信息学研究所(EBI))合作生物剧项目项目.知识图作为数据分析的关键推动者正日益突出,但它们的设计和填充需要仔细的规划和有序的数据。

生物绘图项目将创建一个知识库,将与PDB中的生物大分子的3D结构数据联系在一起,分子的生物活性数据在ChemBL中,以及来自CSD的小分子的结构化学数据。这将允许研究人员:

  • 快速访问可信但完全不同的数据集的相关信息。
  • 利用各种各样的实验确定和计算的小分子属性。
  • 在目标验证,药物开发,药物重新施用和交叉反应等领域的推进工作。

通过向更广泛社区的公平原则扩大我们的奉献,我们有助于确保全世界的研究人员全面地获得世界上最好的结构数据和知识。新利18是真的吗

了解更多

Baidu