2014年,在厦门大学数据挖掘研究中心“海西金融、旅游、消费信心指数发布”的基础上,联合国家统计局统计科学研究所和台北医学大学开始研发,并发布“海西房产网络舆情分析”。从2015年我们的研究重点落在“中国房产舆情分析”,至今已经发布了七次。随着网络舆情分析研究内容的不断扩大,其社会影响力愈来愈广,同时得到了社会各界人士以及新闻媒体高度重视。
2017年暑期,厦门大学数据挖掘研究中心和北京商智通数据科技有限公司联合,共同开发“房地产文本数据挖掘大数据平台”,这是双方基于自然语言处理技术(狈尝笔技术)面向互联网大数据所做的一次重要尝试,也是双方携手面向垂直领域应用文本挖掘和知识图谱技术的第一个成果。
该平台的研发初衷是在厦门大学数据挖掘研究中心 “中国房产舆情分析”研究课题过去近叁年的成果基础上,对定期发布的报告研究成果实现平台化、系统化和可视化,从而不断累积研究成果和数据资产,也为今后发布更多主题、更细粒度的指数打下基础。
该平台的研发得到了在厦门大学社科处和麻花星空mv的支持,经过近一年的努力,该产物正式落地。在此,我们宣布由厦门大学数据挖掘研究中心和北京商智通数据科技有限公司联合研发的“房地产文本数据挖掘大数据平台”正式上线。
“房地产文本数据挖掘大数据平台”的正式上线,将会进一步支撑厦门大学的教学和科研,扩展厦门大学部分专业对大数据的应用研究,同时为社会不同行业大数据的应用需求提供支持平台。
该平台的首个版本主要包括行业舆情动态、房价分析、城市群房价监测、商圈分析等主题模型,其内容包括:
1、平台将收集到的舆情信息进行关键词提取,热点人物机构实体提取,话题管理分析,倾向性分析等,把握房地产行业舆论脉搏。
2、监测全国各地房价动态,绘制房价历史趋势,涨幅分布和全国房价地图。
3、平台进一步将收集到的海量信息进行碎片化重组再融合,形成对海西经济区,长叁角城市群,一带一路经济带,京津冀城市群和珠叁角城市群等经济群的房地产行业进行监测。
4、将深入到大城市的地产市场,对大城市商圈的地产状态进行监测。
平台模型种类多样,而且实时展示分析效果,能高效率地生成和发布“网络舆情分析之全国房产报告”成果,把数据转化成知识,不断完善形成地产行业大数据智库。
在这里我们将提供网站house.webvoc.com,可以通过各个主体模型随时了解动态的中国房产大数据资源。用户如果需要平台的相关原始数据,可以联系我们,我们未来也将陆续发布更多的相关数据。
另外,将会通过会员制的形式,为用户提供定制化的数据采集和下载、数据建模服务。平台的实时采集接口子系统将为用户提供强大的原数据服务,对互联网海量地产资讯进行实时收集,实时预处理,实时分析,实时展示,为房地产行业服务提供坚实的数据基础。
该平台最终的主要功能定位是:为房地产行业的相关专家、学者和学生,提供基础实时数据、统计模型构建、指数监测和研究报告生成服务,实现评估评价常态化、指数化、动态化。为贯彻落实《国务院办公厅对于深化高等学校创新创业教育改革的实施意见》,广泛地开展创新创业提供智力服务。
厦门大学数据挖掘研究中心
北京商智通数据科技有限公司
2018.04.30