在北美,Vainu 一直与商业银行、保险和电信领域的一些最大的机构合作,以解决在其广泛客户群中预测客户保留或流失的艰巨任务。
为了解决这个复杂的问题,我们一直与这些公司密切合作,为他们提供一种机器学习方法,其中涉及我们全球公司数据库的一个关键组成部分:从网络上收集、标记和索引的数百万篇新闻文章。
在这篇文章中,我们将解释我们的 约旦电话号码资源 方法和我们看到的结果。
机器学习理解新闻
Vainu 的全球公司数据库目前拥有超过 1.3 亿个商业实体,从最小的企业到我们运营的每个市场的上市公司。作为构建该数据库的一部分,我们旨在每天阅读、收集和了解有关这些公司的所有文章。
该项目的一部分是从全球新闻文章中收集信息(目前每天 150 万篇),并应用自然语言处理 (NLP) 来进一步了解这些文章中关于公司的描述。除了验证文章的业务相关性之外,我们还使用业界领先的命名实体识别 (NER)来识别提及公司的位置以及谈论的公司。
一旦确定了文章中的企业,我们就会使用由机器学习驱动的分类系统根据文章中发生的变化对文章进行标记:增长或扩张、合并或收购以及人员变动等等。该标记系统已使用大量内部数据集进行训练,这些数据集是通过多种创造性众包方法收集的,包括亚马逊的 Mechanical Turk。
使用新闻文章预测客户流失
经过多年的不断完善,我们对网络上有关公司言论的理解越来越深刻,通过研究数百万家公司和与之相关的数千条新闻报道,Vainu 现在已经证明了收集到的新闻文章与未来的商业决策之间存在实际关联。
在我们的方法中,我们与公司的数据科学家并肩工作,建立预测未来业务结果的定制模型,例如他们的客户是否会继续保持客户关系。在客户保留的例子中,公司向我们提供了客户流失的内部历史数据。这些内部数据与我们在历史结果之前关于这些客户的新闻文章相结合,以形成一个教学集——这是模型预测未来结果的基础。
具体来说,在客户流失预测中,我们使用文本分析和 NLP 来分解每篇新闻文章的内容,然后进行所需的预测。我们已经看到这些文本中的单词与客户离开现有供应商之间存在关联,而且非常成功:
在多个客户中,Vainu 的机器学习方法在客户流失预测方面的验证准确率和测试准确率始终超过 80%。
Vainu 及其客户已经证明,他们的模型和方法是识别风险客户的成功方法,是指导组织客户成功工作的有效工具。