链科创数据库结构与规模
当前,以科研人员为核心的研究议题正在不断丰富,以科研人员为核心的数据库产品正在蓬勃发展。与“中国知网”“ResearchGate”“Linkedin”“科研之友”“迈科技”等国内外大型学术/商用数据库不同,“链科创”数据库聚焦“高校教师数据画像”,多源匹配教师简历信息、科研项目数据、学术论文数据、专利申请数据、师生网络数据、衍生企业数据,形成以人为核心的高校教师创新创业数据库。“链科创”数据库的最大特色是数据整合与多维展现,能够回答“科研人员是谁?科研人员做了什么?”两个问题。
“链科创”数据库的开发团队通过合法、公开、权威渠道采集基础数据,参照国外主流研究的做法,以“教师姓名”为核心,采用各类算法和数据匹配方法,克服了中文姓名的“重名”问题,实现了不同数据源之间的数据打通和衔接,建立了宽口径、广覆盖的高校教师数据画像平台,力求能够精准刻画样本高校每一位教师学术生涯内的创新创业行为。
“链科创”数据库的主要数据来源包括:
▪ 教师个人信息:所属高校及其院系的官方网站
▪ 校教师指导硕士/博士研究生论文信息:中国知网硕/博学位论文库
▪ 自然科学基金资助信息:国家自然科学基金委大数据知识管理服务门户
▪ 标注自然基金编号的学术论文信息:ISI Web of Science论文数据库
▪ 高校教师的中国发明专利申请记录:发明专利商业数据库
▪ 高校教师环高校1km半径(3.14 km2)的企业相关:企查查商业数据库