主页 > 介绍驾驶 >数据比你更懂你:台湾新创团队用文字分析,挖掘客户的心 >

数据比你更懂你:台湾新创团队用文字分析,挖掘客户的心

数据比你更懂你:台湾新创团队用文字分析,挖掘客户的心

语言,作为人类世界的超强推理系统,在未来 AI 人工智慧时代,语言所带来的大量文字数据将成为机器探究你内心的珍贵宝库。然而,相较于拼音系统的英文,中文单词更简短、单字也带有图像化概念,中文进行语意分析时可能门槛较高。那幺,中文世界里的新创团队如何透过文字分析,让数据比你更懂你呢?

语言,人类世界最强推理系统

许晋源指出,语言是人工智慧核心之一,而国内外学术圈探究自然语言分析时的常见研究题目,例如:问答、摘要、推论、目标导向的对话等,即与 AI 人工智慧息息相关。从「语言」出发,路星所打造的交友平台也与众不同。虽然是游戏化交友软体,但相较于多数只强调媒合的交友平台,路星经营理念却围绕着透过「对话」所带来的「真实想法」。

文字数据能呈现使用者所思所想,路星即是藉着不同故事主题的聊天机器人内容设计,刺激使用者针对各个主题产生大量对话,并将对话内容结合 AI 语意分析。路星不仅透过文字数据分析结果,理解使用者真实想法、提升交友配对成功精準度,也透过平台后端语意分析技术,协助广告主精準投放。

数据比你更懂你:台湾新创团队用文字分析,挖掘客户的心
路星资讯长许晋源与团队合照。

除了聊天机器人和对话式广告,路星更将文字分析应用进一步地跨越到心理疾病和群众外包领域。由于社交平台为匿名式,成了不少网友抒发情绪、吐苦水的管道,少数发言内容甚至有自杀倾向;因此路星与学界合作,将文字数据分析应用于情绪分析及心理问题潜在风险预警。

平台的匿名特性,也难免出现部分性骚扰、谩骂等不良言论内容。路星因此打造一个群众外包的人工标注服务,由使用者自行检举,并採用机器学习中的监督式学习来识别、侦测性骚扰和谩骂言词。

从语言出发,回归语言所带来的故事;路星期望透过对话所带来的资讯交换,让人与人的交友关係回归真实的交流与互动。

用 B2B 工具提供文字分析,领业者走完最后一哩路

不过,属于象形文字的中文单词更简短、单字也带有图像化概念,相较于拼音系统的英文,当透过断词进行语言分析时,中文的门槛较高;再加上过去繁体中文语料库和资料集较少,虽然近年台湾产官学研逐渐开放相关资料,但目前还不及英文世界的丰富语料库。

还好,网路时代让应用文字数据分析拥有得天独厚优势。除了资料取得较容易, 黄钟扬更进一步指出,影像较难界定出明确範围,但文字数据不论哪一国语言,都有一定字元数量。因此,文字分析较容易先以大量资料进行机器学习的非监督式学习,之后再以少量资料进行监督式学习,让文字分析的结果更能接近沟通目的。 「影像用来识别和判读,语音用来下指令,文字则是扮演沟通角色。」他为文字数据下了一个简明扼要的定位。

数据比你更懂你:台湾新创团队用文字分析,挖掘客户的心
优拓与公司伙伴每季一次的 outing activity,图为一起去绘画、发挥创意,共同创办人黄钟扬为左前方红衣者。

除了各类型数据在应用领域各有其不同角色,企业在 AI 人工智慧领域也各自扮演不同角色;优拓资讯即是期望扮演「专业工具」提供者的角色,透过工具来协助业者驾驭最新的 AI 技术,让自身的服务得以落地,走完人工智慧最后一哩路。

优拓资讯以自然语意分析技术自行研发自然语意理解引擎,并以开源聊天机器人框架 Bottender 为基础,开发完整、好用的对话式 AI 建置工具 Yoctol.AI,协助企业打造可以即时回应客服需求、甚至进行分众行销的对话机器人。优拓资讯曾协助许多大型企业建置客服与行销机器人,接下来的目标是将 Yoctol.AI 工具开放,让所有的企业、商家、甚至是个人都可以创造出聪明的对话机器人。

上世纪问世的当今科技巨擘 Google,企业名取自宇宙最大单位「googol」;而优拓资讯企业名 Yoctol 则取自宇宙最小单位「yocto」,期望透过文字数据见微知着,在 21 世纪的现今,从最小的资讯当中发掘出最大的应用价值。

数据应用是一段不断反馈的过程,不该为数据而数据

相对于影像或语音,文字数据较容易结构化,资料量又较易累积,已长期扮演企业发展数据应用的垫脚石。儘管新版本的 AlphaGo Zero 早已透过大幅跃进的运算技术跳脱数据量限制,但人类世界终究不若围棋世界规则明确、胜负分明,企业在发展数据应用时,也不能为数据而数据。

他表示,虽然目前许多议题都可以发展数据应用,但仍得回归企业本身经营方针,并用数据协助判断决策方向。例如,在各个不同发展阶段,AsiaYo 都有不同策略目标。从如何新增用户数量、如何冲高订单数、如何增加合作民宿数量、如何协助新招募旅馆订到第一批客人,到如何提高整体营收,每个阶段都得採用不同的数据应用决策。

数据比你更懂你:台湾新创团队用文字分析,挖掘客户的心
AsiaYo 创办人暨执行长郑兆刚,

而在这不断成长的过程中,身为结合文字数据分析的跨区、跨语言旅游智慧订房平台,虽然已经拥有台、日、韩、泰等地超过六万个房源,当许多企业倾向採用聊天机器人来处理不同语言市场的客服业务时,AsiaYo 则仍然以真人为客服主力。

「真人是最后一步,複杂问题得用真人处理;因为绝多数打电话来的顾客都是遇到难题,他们需要与真人讲讲话、发洩情绪。」他认为,虽然大多数结构式资料可以透过机器处理,例如:确认或修改订单、回答基本问题、进行精準行销等;但从服服务业长远经营角度来看,若要让使用者觉得平台不会「弃你于不顾」,专职的真人客服仍得随时在线,才能打造良好的服务体验。

语言带来的大量文字数据,将成为机器探究客户内心样貌的珍贵宝库;目前政府对于资料运用和数据创新等发展也十分重视,今年度经济部工业局以数据创新服务生态系推动计画,着重于辅导数据新创团队发展各种资料创新应用,而这个早已被长期应用的文字数据,在未来 AI 人工智慧时代又有什幺样的新型态应用?想 了解在万物联网时代,如何透过文字分析让数据比你更懂你,请即刻报名 资策会于今年 11 月 29 日举办的 「创新、创意、创业,打造数据新契机」论坛暨讲座活动。在上午场的数据应用论坛当中,资策会将邀请 INSIDE 编辑担任主谈人,与旗舰团队一同探讨「智慧旅宿科技应用与扩散」,并由新创 CTO 倾囊相授「如何活用数据发展创新事业」;而下午场的新创与趋势讲座,更将带您参与拥有卓越成果的台湾新创团队,在文字和影像数据创新上的应用思维与实战经验。

经济部工业局 广告

数据比你更懂你:台湾新创团队用文字分析,挖掘客户的心

「创新、创意、创业,打造数据新契机」论坛暨讲座活动资讯



上一篇: 下一篇: