基于手工特征的方法:文本特征:评论长度、可读性(如Gunning雾指数)、情感倾向、词性标注等。图像特征:像素值、亮度、对比度、图像中的物体数量等
基于深度特征的方法:文本特征:使用BERT、LSTM、GRU等模型提取的文本嵌入。图像特征:使用CNN(如VGG-16、ResNet)提取的图像特征。长短期记忆网络(LSTM):用于表示文本的上下文信息。卷积神经网络(CNN):用于表示图像的局部空间信息。
手工特征与深度特征的互补性:手工特征和深度特征在RHP中具有互补性。手工特征提供了浅层但可解释性强的信息,而深度特征提供了高维但难以解释的信息。结合这两种特征可以提高RHP的准确性和可解释性。
现有研究方法的局限性:(1)现有研究中同时考虑这两种特征的工作非常有限。(2)多模态数据融合的简单方法 通常只是简单地相加或拼接两种模态的特征,而没有考虑模态内(intra-modal)和模态间(inter-modal)的依赖关系。(3)多模态融合技术的潜力未被充分利用:在RHP中,先进的多模态融合技术的潜力尚未被充分探索。(4)预测能力和可解释性的平衡缺失:当前的RHP模型在预测能力和可解释性之间缺乏平衡,这给将以往计量经济学研究结果与预测研究结果有效整合带来了挑战。