摘要:目前,Web数据的抓取和挖掘成为计算机研究和开发中的热点,同时,抓取和挖掘到的数据进行地理空间化也越来越受到关注。地理空间化后的数据可视化也渐渐成为地理信息系统发展的一个重要方向。本文所述的方法是对人力资源网站进行在线实时的计算机软件职位Web内容抽取,将获取到的职位招聘数据通过在线地图服务进行地理空间定位,然后把地理空间化后的相关职位信息通过动态集束线和动态点进行地理空间可视化表达。从实现的Demo实验效果来看,地理空间动态集束线的流向图表达方法比传统的静态表达更能够促进用户获取数据之间各类流动和迁徙等方向的空间关系,帮助理解在其他形式表达下不易发觉的空间模式。在本文实现的方法中,通过计算机招聘职位的工作所在地与公司所在地之间的动态集束线可视化表达,除了能够显式地收集工作岗位职位空间分布情况,还获悉了当前计算机软件行业的计算机软件产业迁移的态势。
关键字:Web数据抓取和抽取;数据地理空间化; 数据可视化;数据线可视化;集束线表达
引言
随着大数据、数据挖掘和知识发现在计算机的研究和应用,数据的可视化技术也越来越受到人们的重视。数据的可视化主要通过人的视觉感知到的计算机图形或图像为基础,描述和展现数据的模式、趋势和关系,而某些数据的某些性质是难以用其他表达方式呈现所能被发现的。数据可视化的功能实质就是将获取到的数据转换和映射为图形、图像、动画等等。如图1所示为数据可视化的领域模型。
|