|“丝路大学联盟e计划”阶段性成果汇报
2018/10/15 11:18:22“丝路大学联盟e计划”的目的是充分互联网,搭建一个联结新丝绸之路经济带相关高等教育和研究机构的平台,发挥由西安交通大学发起成立的“丝路大学联盟”的作用,采用最新信息技术实现课程、人员、教学活动的交流共享,切实推进联盟的各项工作,为全球特别是“一带一路”沿线国家提供工程科技知识的建设、汇聚、服务和人才培养的支撑与服务,实现“打造国际合作新平台,形成开放交流新格局”的战略目标。
截至2017年11月,本项目阶段性成果和进展汇报如下。
第一、技术平台的研发进展。
“新丝路大学联盟e计划”的支撑平台,命名为丝路工程科技知识服务系统。其系统架构如图1所示。
图1 丝路工程科技知识服务系统架构
丝路工程科技知识服务系统分为三层:系统集成层、数据服务层和信息展示层,并通过统一用户权限管理、统一身份认证CAS单点登录、统一门户管理、统一资源发布管理、统一数据显示规划等保障系统的运行。
在此框架下,项目组开发完成了资源管理系统、用户管理系统、培训管理系统等支持保障系统,攻克了资源的爬取、分析、处理、索引等关键性技术问题,初步搭建起了围绕“一带一路”的工程科技知识服务门户。门户系统界面如图2所示。
图2 丝路工程科技知识服务系统门户界面
1、资源管理系统
资源管理系统主要功能包括资源的统一存储与管理,能够对论文、文献、图书、专利、开放文献等不同类型的数据资源进行集中的管理。针对资源管理人员,支持大批量的数据导入和导出功能;同时,系统还提供针对个别数据的加工完善功能。在系统扩展性方面,系统提供灵活的数据接口,对元数据的定义更加灵活。
2、用户管理系统
完成了用户在线注册、统一身份认证、用户管理、角色权限管理等功能,能够完成目前基础的用户资料的存储等功能。此外,开发了用户行为日志采集与统计分析功能,为利用大数据技术挖掘分析用户的潜在需求、提供更为精准的技术支撑服务保障打下基础。
3、培训管理系统
培训管理系统主要包括培训项目的在线管理和培训学员的在线管理两大基本功能,包含培训项目管理、新闻消息发布、报名人员管理、注册人员管理、结业人员管理、人员统计等六大类具体功能,通过该系统可实现对培训学员档案的持续跟踪管理,从而积累丝路工程科技人员发展档案库,为项目延伸至海外积累人脉。
4、主要应用模块
系统主要规划三类应用模块:知识检索类模块、信息服务类模块、特色应用类模块。
1)知识检索类模块
主要提供针对全站资源的模糊搜索、关联搜索、联想搜索等智能检索服务。同时提供树形结构目录,针对特定资源进行分面检索。
2)信息服务类模块
主要对从12个学协会网站中爬取的工程科技类新闻动态、学术会议信息等进行实时动态展示,供用户及时获取最新的学术前沿动态信息。
3)特色应用类模块
主要建设了6大特色应用:
丝路大学联盟。通过该模块,用户以图形化的界面访问到134所由我校发起并建立的丝路大学联盟盟校的门户网站,了解学校的基本情况,同时将各类资源与各盟校进行了关联,便于用户了解某一所丝路大学联盟盟校的科研产出情况。
图4 丝路工程科技知识服务在线学习模块
知识图谱。用有向图的形式将特定领域类的工程科技知识进行关联,使得用户在学习某一知识的过程中能够及时了解先导知识和后继知识,便于用户组织学习。目前,系统主要针对高等数学体系内的知识建立了图谱。
图5 丝路工程科技知识服务知识图谱
专题培训展示与管理。主要将培训管理系统的前台进行集成展示,与后台管理功能相互分离,为用户提供统一的用户使用界面,用户通过该模块主要用以了解培训信息,并进行相关培训的注册和报名等。后台对专题培训进行管理,包括培训专题、课题、教师的安排等。
图6 丝路工程科技知识服务专题培训集成展示
图7 丝路工程科技知识服务培训管理
图8 丝路工程科技知识服务专题培训详细信息
个性化推荐。通过“用户聚类+兴趣模式发现+自适应协同过滤”的资源推荐方法,从用户的行为数据中发现用户的兴趣点,通过知识点导学,完善用户知识体系。根据用户习惯向用户进行有效的资源推荐,提高知识资源的有效利用率。
在上述功能模块建设中,项目组重点进行了以下三项技术的攻关。
1、数据处理技术
项目建设过程中,数据的爬取、分析、处理、索引等数据处理技术尤为关键。在数据爬取过程中,构建了20余个爬虫,针对丝路沿线国家学术机构、高校等工程学术机构、学协会等爬取新闻热点、会议信息以及开放数据资源;在数据的分析处理过程中主要将爬取到的数据进行ETL过程,对数据进行清洗并进行存储,同时提供批量资源的整体加工和导入、导出功能;利用Elasticsearch集群对全站所有数据资源建立自动索引服务。
2、静态数据的集群存储与海量数据的分布式存储
系统的数据主要可以分为两类:一是静态的常用检索数据,为了提供信息搜索的效率,这类型信息将会以结构化的形式同步到数据库集群,保证数据的本地完整性,增强数据检索的性能,并且降低跨虚拟机检索带来的系统延时;二是海量的工程科技信息,此类信息中的文本信息将以分布式的方式存储到多台虚拟主机,而其中的非文本数据(例如图片、视频)将进入分布式文件系统存储并辅以高效的抽取机制。
3、大规模网站的技术框架设计
为了使系统满足大规模知识获取的需求,系统技术框架的设计应为技术工作的重点,为后续工作打好坚实的技术基础,提高系统综合性能和用户体验。网站框架的设计应满足:海量数据储存与高效检索;面向工程科技群体的高并发性能;高效的前端结构和快速响应时间;迅速的更新和资源扩展。框架设计的主要关注点为:性能、高可用性、可管理、可扩展性。
第二、丝路特色资源的建设进展。
丝路工程科技知识服务系统建设以数据资源为核心,通过提供不同的知识应用满足用户个性化需求,同时针对用户区域变化的多语言提供支持和扩展。其中,工程科技文献知识服务、丝路工程科技学术交流服务、丝路机构知识服务中的数据资源建设是建设的重点。
1、特色资源收集
工程科技文献知识服务主要收集丝路大学联盟盟校(国内)工程科技期刊文献、学位论文、研究专著、研究报告、新闻报纸等文献;丝路工程科技学术交流服务是搜集整理和及时发布重要的工程科技国际会议信息、收录重要的国际工程科技组织、典型理工科大学主页信息和出版物信息、丝路大学联盟(境外)工程科技学术会议信息和重要组织的学术前沿动态信息;丝路机构知识服务为搜集丝路大学联盟各盟校工程科技相关教师、科研人员的具有知识产权的学术研究成果(例如期刊文章、会议论文、学位论文、著作或译著、课件等)。
丝路特色资源收集的完成情况包括:机构知识数据建设、西安交大专利文献建设、西安交大学位论文建设、书目级中外文书刊资源建设、开放获取外文文献资源建设、丝路大学联盟盟校科技期刊文献等,建设用于提供数据服务的外文文献资源数据等。本校机构知识数据建设方面,完善本校学者公开发表各类成果元数据和部分全文数据,建设完成机构知识库数据4万条。西安交通大学专利文献2千条、中外文电子图书书目级元数据36万条、中外文电子期刊1.5万条。另外,建设开放获取文献资源15万条,建设丝路大学联盟盟校科技期刊文献元数据5万条。建设音视频资源库10门课程和丝路资源动态消息3000条。还提供部分特色资源,如投资环境文献和企业基础信息等。具体完成情况如表1所示。
表1 丝路特色资源收集一览表
数据类型 | 完成数(条或讲) | |
本校机构知识库 | 40,000 | |
开放获取外文文献资源 | 160,000 | |
书目及中外文电子期刊 | 16,000 | |
书目及中外文电子图书 | 377,213 | |
丝路盟校科技文献 | 62,000 | |
视频公开课 | 13 | |
丝路资源动态信息 | 4,090 | |
本校专利文献 | 2,258 | |
各类外文资源(包括特色资源、文章、其他专利文献等) | 334,360 | |
特色资源 | 百强企业报告 | 88 |
国家报告 | 2,242 |
2、特色资源库建设
在以上基础上,项目组构建了丝路沿线国家国情咨文、人口环境、工业经济、政策法规、教育科技、历史文化等相关六大特色数据库。
国情咨文数据库主要收集丝路沿线国家相关的国家发展报告,投资环境评估报告等报告,帮助用户及时掌握全球市场的主要事件,并研判事件在中短期内将会产生的影响;历史文化数据库主要收集丝路沿线国家历史文化相关的图书、文献等,如沿线国家相关的区域政治,经济,文化,发展策略与政治研究等;工业经济数据库主要收集与丝路沿线国家相关的世界五百强企业的SWOT分析等企业发展报告,提供企业深入的行业分析、有关公司的地理位置、财务摘要、主要竞争对手、高级官员等的信息;政策法规数据库主要收集丝路沿线国家相关的政策法规、技术标准等文件和资料;教育科技数据库主要收集丝路沿线国家有关教育、科技类的文献、期刊、图书、专利、论文以及音视频资料。
图9 丝路工程科技知识服务六大特色数据库
2017年2月27日,联合国教科文组织国际工程科技知识中心丝路培训基地正式落户西安交大,更好地发挥西安交大在工程科技教育方面的优势,在更大范围内、持续稳定地为“一带一路”沿线国家培养工程科技人才。项目组以此为契机,共开展18期“丝路工程科技发展专项培训”,培训学员1439人次。
1、主要课程设置
开展的18期“丝路工程科技发展专项培训”,包括2期“大数据理论与实践创新应用”、4期“物联网理论与实践创新应用”、6期“医学科技前沿发展”、2期“人工智能与大数据实践创新应用”、1期“丝路文化与科技发展”、1期“生命科学前沿”等专题培训,以及1期“新型功能材料”和1期“魅力化工”。培训采取“理论讲授+案例解析+交流研讨+现场教学+动手实践”的混合全英文教学模式,受到参训学员的好评。
代表性课程介绍如下:
(1)“大数据理论与实践创新应用”
主要课程模块包括大数据理论专题、公共课程专题及参观实践,课程设置主要有:数据的产品化管理,商务大数据分析,云计算与大数据分析,信息技术的发展驱动的管理与商业创新,一带一路的历史与未来,管理与营销---中国视角,中国对外交流简史、娱乐产业的法律问题等,参观实践环节主要包括观摩、研讨、现场交流等环节,教学地点包括西安交通大学快速制造国家工程研究中心3D打印成型技术及中兴通西安研究院等高新技术产业区。
(2)“医学科技前沿发展”
主要课程模块包括医学基础、临床医学及公共课程,课程设置主要有丝绸之路沿线感染性疾病防控的发展趋势、分子医学时代的机遇与挑战、机体功能系统稳态机制的维持与失衡:从正常功能到功能异常、内分泌疾病诊治进展、妇产科的奇幻之旅、肾细胞癌的诊治进展、中国传统文化赏析及中华剪纸快乐体验、3D打印在矫形外科中的应用、消化道出血诊治进展等。
(3)“物联网理论与实践创新应用”
主要课程模块包括物联网理论专题、公共课程专题及参观实践,课程设置主要有:课程设置主要有第5代移动通信系统与网络概述、物联网下的安全挑战、软件定义网络、物联网与大数据、面向物联网的智能器件与系统、物联网时代的概念技术及挑战、物联网与智慧生活、中国文化概述等。参观实践环节主要包括观摩、研讨、现场交流等环节,教学地点是西安交通大学快速制造国家工程研究中心3D打印成型技术。
(4)“人工智能与大数据实践创新应用”
主要课程模块包括物联网专题、公共课程专题及企业参观实践,课程设置主要有人工智能简介、信息技术的发展及其商业应用、模式识别与机器学习及其应用、数据的产品化管理、云计算与大数据分析、智能无人车的自主驾驶、一带一路的历史与未来、中国对外交流简史等。参观实践环节主要包括观摩、研讨、现场交流等环节,教学地点是中软国际有限公司。
(5)“丝路文化与科技发展”
主要课程模块包括“一带一路”发展脉络:历史与未来,机遇与挑战中国对外交流简史、国学思想之个人修养、一带一路的经济分析、中国与俄罗斯、中亚关系的历史回顾与未来展望、快速制造技术及其应用----产品数字化快速开发技术与应用等。
(6)“生命科学前沿知识”
主要课程模块有人乳头瘤病毒—癌症与疫苗、一体化结构生物学方案在转化医学中的应用、癌症治疗的现状与展望、囊泡循环、神经分泌与神经退行性疾病、创新思维与交叉研究、组织工程与再生医学、聚羟基脂肪酸酯微球及其生物医药应用、从炼丹到克隆:健康长寿,路在何方?(中国衰老与抗衰老研究简介)等。
图10 丝路工程科技知识服务培训现场图
2、培训学员统计
18期专项培训共计培训学员1439人次,分别来自埃及、巴基斯坦、埃塞俄比亚、安哥拉、俄罗斯、吉尔吉斯斯坦、哈萨克斯坦、肯尼亚、也门、马来西亚、乌兹别克斯坦、巴林、尼日利亚、孟加拉国等80个国家以及中国香港、中国台湾的留学生及交换生。培训学员中,所学专业分别为临床医学、电气工程、管理科学与工程、机械工程、电子信息工程、能源与动力工程、计算机科学与技术、航空航天、信息与通讯工程、控制科学与工程、ACCA、材料、数学与统计、化学等41个专业。
每位培训学员都具有详细信息,方便培训后继续在“一带一路”国家扩展联系和影响力。培训学员详细信息如下图所示。
图11 丝路工程科技知识服务培训学员详细信息