不需要一个人来预测Airbnb的挂牌价格- 提供客户评论和租赁功能的AI模型可以解决问题。这是斯坦福大学一组研究生得出的结论,他们在Arxiv.org上的一篇论文中进行了调查(“ 使用机器学习和情感分析的Airbnb价格预测 ”),该系统利用机器学习和自然语言处理来预测未来的Airbnb利率。

除了本文,他们还在GitHub上提供了优化的模型。
在Airbnb上为租赁物业定价对房主来说是一项艰巨的任务,因为它决定了该地点的客户数量。另一方面,客户必须在不了解该物业最佳价值的情况下评估报价。” “本文旨在使用机器学习,深度学习和自然语言处理技术来开发可靠的价格预测模型,以在不提供有关该属性的最少信息的情况下,帮助业主和客户进行价格评估。”
为了训练他们的价格预测系统,研究人员利用了纽约市的公开Airbnb数据集,其中包括50,221个条目,共有96个功能。他们检查了每个功能,以删除那些缺少字段且经常无法修复的功能,并将布尔值更改为二进制,并删除重复的和“无用”的功能,例如主机图片URL。(这将功能的数量减少到22个。)在培训过程中,团队使用了原始数据的90%(39,980个样本),保留了5%的验证和测试(9,996个样本)。
在培训之前,该团队利用开放源代码TextBlob语料库来分析列表评论的情绪,这给每个评论分配了-1(非常负面的情绪)和1(非常正面的情绪)之间的分数。分数是与给定列表相关的所有评论的平均值,并作为一项新功能包含在训练数据集中。
该团队测试了几种预测价格的机器学习技术,包括线性回归,基于树的模型,SVR和神经网络。但是他们报告说,性能最佳的模型-支持向量回归(SVR)-在测试集上获得了69%的R2分数(衡量预测对真实数据点的逼近程度)。
共同作者写道:“鉴于数据集的异质性以及所涉及的隐藏因素和交互性术语(包括所有者的个人特征,这是无法考虑的),这种准确性水平是一个有希望的结果,”他着手今后的工作,收集了更多信息。训练示例并尝试使用新颖的神经网络架构。

