大数据地球观测技术与工具加强研发是欧盟H2020研究与创新项目,于2017年11月启动,至2020年10月底结束。该项目的主要目标是 合规营销数据的门户 基于海量异构地球观测数据集,实施大数据解决方案称为数据管道) 。这将有助于解决关键的社会挑战,使用户能够专注于分析和提取数据中的潜在知识,而不是数据本身的处理。
后,发起人将在研讨会上验证管道需求 并与专门的开发团队共同设计解决方案。在实施过程中,发起人可以持续测试和验证管道。之后,已实施的管道将在 Hackathons 活动中向公众开放,从而能够在其他领域使用特定的解决方案,并收集更多用户反我们很高兴地宣布 SANSA 0.4 的发布——可扩展语义分析堆栈的第四个版本。SANSA 通过 Apache Spark 和 Flink 采用分布式计算,从而 为大型知识图谱提供可扩 展的机器学习推理和查询功能。 您可以在 找到常见问题解答和使用示例。目前支持以下功能: 格式读取和写入 RDF 文件读取各种标准格式的 OWL 文件支持多种数据分区技术进行 SPARQL 查询通过 GraphX 遍历使用 SPARQL (1.0) 对 RDF 进行图形并行查询(实验RDFS、RDFS Simple、OWL-Horst、EL(实验)前向链接推自动推理计划创建(实验使用不同算法的 RDF 图聚类术语决策树(实验)异常检测(测试版)知识图谱嵌入方法: T (测试版(测试版) 自上一版本以来值得注意的变化或更新包括: 解析器性能已得到 例如可以加载 DBpedia 2016-10支持更广泛的数据分区策略跨数据表示(RDD、DataFrame、DataSet、Graph)的三元组操作的更好的统一 API提高单元测试覆盖率改进的分布式统计计算(参见 进行初步可扩展性测试 新的 SPARQL-to-GraphX 重写器旨在为利用图局部性的查询提供更好的性能在 DBpedia 上测试的数字异常值检测(英文)在 20 GB RDF 数据集上测试了改进的聚类 部署和入门:有适用于 Apache Spark 的 SBT 和 Maven 以及 Apache Flink 的模板项目 可供 开始使用。SANSA jar 文件位于 Maven Central,即在大多数 IDE 中,您只需搜索“sansa”即可将依赖项包含在 Maven 项目中。
|