【摘要】:图5.总体活动桑基图图6.全文本高频词与词频每一名建筑师都有其独特之处,在探索张轲的独特个性时,采用“TF-IDF”⑨统计方法提取关键词。经过进一步筛选后,将张轲的关键词按照频度递减的顺序自动排序,采用最典型的可视化方式之一“词云”⑩来展示分析成果,其中文字的大小代表关键词的频度大小(图7)。
图5.总体活动桑基图
图6.全文本高频词与词频 (www.xing528.com)
每一名建筑师都有其独特之处,在探索张轲的独特个性时,采用“TF-IDF”⑨(term frequencyinverse document frequency)统计方法提取关键词。基于给定文本的总体TF-IDF算法用以评估某个词对于张轲全中文文本库中的单独一份文章的重要程度,字词的重要性随着其在文章中出现的次数成正比增加,但同时会随着它在全文语料库中出现的频率成反比下降,这种加权形式可以得到张轲独有的“关键词”[5]。总体处理后得到如“西藏”“微胡同”“文化”“院落”等高频关键词。经过进一步筛选后,将张轲的关键词按照频度递减的顺序自动排序,采用最典型的可视化方式之一“词云”⑩来展示分析成果,其中文字的大小代表关键词的频度大小(图7)。
与此同时,基于张轲的中文全文本做进一步地挖掘,应用“Text Rank”算法⑪提取出关键词,再加入时间的维度,由此得到了张轲从2001年创立标准营造起,至2017年在时间维度上关键词的变化与演进。最初,张轲关注于历史与历史建筑的保护,这反映在他早期的北京东便门明城墙遗址公园、白塔寺历史文化保护区商业步行街规划、余姚古城历史街区保护规划几项规划设计中;而随着项目的积累,他的关注点逐步扩展到地域、社会、文化与人等多个方面(图8)。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。