11月19日,北京大学科技成果发布会暨北京市科技成果转化统筹协调与服务平台系列项目路演——北京大学王选计算机研究所专场在北京大学英杰交流中心举行。活动项目路演环节中,王选所发布了4项重大科技成果:大规模图数据库管理系统(gStore)、AI写作机器人、自适应并行低时延编码框架技术及文档泄密溯源追踪技术。北京市科委副主任刘晖、北京大学副校长兼教务长龚旗煌院士出席发布会并致词; 北京大学科技开发部副部长郭蕾和王选计算机研究所所长郭宗明主持了发布会。
其中,面向知识图谱应用的大规模图数据库管理系统(gStore)作为第一项重要成果在北大科技成果发布会上发布。gStore系统是北京大学邹磊教授及其团队——北大王选计算机所数据管理实验室(PKUMOD),历时8年研发具有“原始创新—核心授权专利和软件著作权—科研获奖—应用落地”的完整自主知识产权链条的大规模图数据库管理系统。
gStore系统首创性地提出了将面向知识图谱的查询转换成在大图中进行子图匹配的解决方法;该方法抛弃了传统利用关系数据库技术作为底层支持知识数据的存储和管理,利用基于结构感知的索引和查询优化策略,极大地提高了在海量知识图谱数据和复杂查询环境下的系统性能和可扩展性。目前gStore单机可以支持50亿知识三元组的数据管理,分布式版本可以达到百亿边规模以上的知识图谱数据。gStore系统在图谱数据量大且查询复杂的情况下,性能明显优于现有的工业图数据库系统,处于该领域国际领先的地位。
围绕gStore系统的核心技术,邹磊教授发表了包括数据库领域顶级期刊/会议论文(SIGMOD,VLDB等)30余篇,被国内外引用2000多次,并获得国家教育部自然科学二等奖一次;gStore系统已经获得授权专利7项、软件著作权2项。
教育部自然科学二等奖
(“大规模图结构数据管理”)
gStore系统目前已经应用于政府大数据管理、企业知识图谱服务和多源数据融合分析等多个领域;另外,gStore系统提供了“开箱即用“的云端服务;已成功应用于包括方正电子、北大软件、深圳证券信息有限公司、深圳狗尾草智能科技有限公司在内的多家企事业单位,在金融、出版和法律等多个领域的知识图谱项目和大数据集成平台中,产生了良好的社会和经济效益。
gStore系统只是此次北大科技成果转化工作的内容之一,今后北京大学还将持续开展常态化的项目路演,搭建大学与政府、企业、投资机构在成果转化、资源共享、产业衔接的平台,为北京建设全国科技创新中心提供有力支持,为经济社会发展贡献力量。出席本次活动的嘉宾还有中国科学报社副总编张明伟、北京大学科技开发部部长姚卫浩、北京市科委高新技术成果转化服务中心主任王兰平,以及北大校友、合作企业、兄弟院校、北京科创母基金、方正和生、北京高校技术转移联盟等多家机构代表共140多人。
gStore图数据库系统的优势
源头创新
学术界首次提出以子图匹配方法构建知识图谱存储查询引擎; gStore系统核心发表3篇数据库领域顶级论文(SIGMOD,VLDB,VLDB J),单篇最高引用率超过200次;
自主可控
8年潜心研发,受国家重点研发计划资助,系统10万行代码均为自主编写,拥有从“论文-专利-软件著作权”整体知识产权体系,系统完全国产自主可控;
实战部署
完成产品级研制和实战化部署,已应用于金融、政府大数据、智能问答机器人、电信欺诈检测和公安大数据等项目;
性能卓越
中国软件测评中心测试结果显示,分布式gStore支持百亿边规模的图数据的可扩展性,且平均查询响应时间为秒级。国内外学术同行、多个系统应用方及权威测试机构评测报告均显示:性能明显超越国外同类图数据库产品,在大规模图数据和复杂查询中表现更为突出。
|