(通讯员:郝若辰)2025年4月11日,清华大学人文学院李飞跃教授做客南开中文伯苓讲堂,为我院师生带来以“数字人文与《红楼梦》文本探勘”为题的精彩讲座。讲座由古代文学教研室主任杨传庆主持,相关专业青年教师及数十名硕博师生参加。
关于《红楼梦》作者归属研究,李飞跃教授指出,计量语言学方法能有效对比《红楼梦》前80回与后40回的文本风格差异,不过仍需注意文本非匀质性带来的干扰,避免将基于情节进展的写法变化简单归因于作者更易。为考察曹雪芹的知识来源与阅读结构,李飞跃教授团队选取《红楼梦》中的诗词,采用边际距离、doc2vec等算法,系统分析了《红楼梦》诗词与唐代诗歌的文本相似度。研究发现曹雪芹的化用并非简单挪用,而是创造性地进行语境迁移,并且《才调集》在曹雪芹的知识结构中占有重要位置。对于情感分析及其可视化,团队通过情感词的分析标注,量化验证了“钗黛合一”这一红学经典命题。情感曲线显示,黛玉、宝钗在前60回的情感发展呈现出明显的“对立→趋同”态势,与脂砚斋“钗、玉名虽两个,人却一身”的批语高度吻合。类似的模式也出现在晴雯与袭人的情感线上,这再次印证了“晴为黛影,袭为钗副”的说法,有助于理解古代叙事文学“互文见义”的复调结构。
讲座最后,李飞跃教授客观评价了数字人文方法的优势与局限。虽然数字人文方法仍面临一系列挑战,但其透明性、可验证性能够很好地补充传统直寻式的研究理路,同时也使得数字人文工具的建设者与使用者同样成为被批评和审视的部分。