人机交互 家电 语音语音交互技术带来的感想

新闻关键词
行业新闻 推荐新闻
行业新闻 热门排行
自动化新闻 热门排行让梦想驰骋于智能人机交互技术(HCI)发展之路上_语音合成_语音识别_CTI论坛
让梦想驰骋于智能人机交互技术(HCI)发展之路上
  CTI论坛(ctiforum)10月14日消息(记者 张洁):在这个信息快速传播的时代里,人与机器间的“对话”变得越来越密切,人们用眼睛、嘴巴和手等各种肢体器官,在与各式各样的机器设备之间做着频繁的互动。现在我们可以通过智能手机下载各类智能软件,以实现与手机之间的“对话交流”;用手指或笔在一些终端触摸屏上进行手写,就能轻松发送短信、邮件、微博;一句句亲切的问候,只要动动嘴,文字很快便呈现在眼前,即刻发送给你的亲朋好友;一张朋友或客户的名片,只需用手机一拍,其信息便可自动储存进手机或电脑的通讯录内;对于正在集中精力开车的驾驶者,还可随时听到导航仪中传来悦耳的提醒声,不仅让你避免多走冤枉路、为你节省大量能源,还可使你的驾驶过程更加安全。智能人机交互技术(HCI)发展到今天,对我们来说已不再像十几年前那样陌生,现在它正在逐步走进大众的视野、生活,成为流行、时尚的代名词,并已经成为我们日常工作、生活的最佳帮手。
  捷通华声公司成立于2000年10月,公司总部设在中关村软件园内,是一家立足中文语音、手写等智能人机交互技术研究与应用,全面发展移动互联网应用与服务的高新技术企业。2001年,推出了代表国际较高水平的中文语音合成技术,全面开启了中国中文语音合成技术在计算机通信、电信增值服务等应用领域的实用化进程。2006年创建智能交互技术研发中心(HCI),全面进军语音、手写识别等智能人机交互技术领域。
  捷通华声的语音合成(TTS)技术产品遍及金融、电信、电力、政府等行业,服务于各类信息平台的语音播报应用,不仅为话务员减轻了话务量,为运营者降低了运营成本,更为广大咨询者最大限度地减少了获取信息的等待时间,得到高效一流的服务。目前80%以上的金融领域企业客户服务中心平台中,都在大量应用着捷通华声公司的语音合成(TTS)技术产品。多年的技术及市场行业推广积累,使得捷通华声语音合成(TTS)技术产品在业界已处于领先地位。特别是在北京奥运会、上海世博会、广州亚运会等重大国际活动上的广泛应用,不仅展示了我国语音技术产品的全球领先性,更是极大促进了语音技术产品的信誉度与普及度。捷通华声另一项核心技术手写输入识别技术发展已有十多年的历史,联想、索爱、夏普、中兴等国际知名手机里应用了捷通华声的手写输入识别产品。
  捷通华声语音、手写识别输入技术在移动终端产品中的优异表现,已成为新一代年轻使用群体热衷追求的时尚之品。具有移动互联网特质的录易手写输入法(Android版)在各个软件商城中已成为热门下载产品;捷通华声推出的基于智能手机Android系统的的《捷通听书》软件现在已成为听书爱好者的最佳伙伴、棋牌网游《天行乐园语音斗地主》令玩家玩儿起来乐不思蜀;近十年来,捷通华声研发的具有语音合成技术特点的应用软件在中国电信Brew业务上也取得了非常优异的成绩,手机软件《动感天气预报》、《天行短信会说话》在多年的研发并应用后的今天,依然有很多人热衷于下载到自己的手机中去听、去玩儿、去使用,拥有了成千上万的忠实用户。
  捷通华声近年来,在HCI与移动互联网服务领域的成就,引起业界的广泛关注,2011年,捷通华声凭借自身的综合实力,荣获了“2010中关村高成长企业TOP100”称号,并同时获得本年度特别奖――“最受媒体关注”奖。这更加坚定了捷通华声新的战略目标,在十二五开局之年,立足于HCI核心技术,全面发展移动互联网,继续坚持务实进取的企业理念,进一步培养人才及团队并广揽人才,不断建立短、中、长期激励体系,构建积极向上的团队,共同赢得移动互联网发展所带来的巨大机遇!
  捷通华声作为归国留学人员创办的高新技术企业,历经数年发展,捷通华声进入快速增长的发展态势,为优秀人才的不断涌现,提供一方可施展才华的舞台,捷通华声真诚邀请研究开发、软件测试、技术支持、市场营销、行政管理等领域中有识、有志、有梦想、有能力、有热情、有经验的有识志士加盟,一起驰骋于HCI智能人机交互技术发展之路上!
CTI论坛报道
热点专题:&&&&
电话:010-79677 传真:010- 呼叫中心建设及运营管理咨询服务:010-
京ICP证030771号
All rights reserved从落后到先进 人机交互技术的发展与未来
> 从落后到先进 人机交互技术的发展与未来
从落后到先进 人机交互技术的发展与未来
  还记得《阿凡达》吗?电影里,人类一按启动键,一幅全息立体的操作界面即呈现在眼前,随手一点,程序就打开了,随手一划,数据就按意愿移动&&公众何时能够拥有这样的计算机?这一问题,也在日前在京举行的2010年中国研讨会上引发热议。中国科学院软件研究所戴国忠教授认为,2020年,人和计算机的生理界限将渐渐消除。本文引用地址:
  是什么?
  ,简单来说,就是人类与计算机交流互动。两者之间有这样一个传导链:通过人机接口技术,使人能够与计算机发生联系;而计算机则通过一种界面,使人能了解联系后的效果。
  想必生于上世纪70年代的人还记得,为了使用计算机,学习DOS命令的辛苦阶段吧?没错,这就是人机交互的早期阶段。人们只有熟练掌握大量命令语言后,才能高效地操纵计算机。
  然而,随着计算机技术的飞速发展,人机接口技术不断改进:从早期的穿孔纸带、面板开关和显示灯等交互装置,发展到今天的动作追踪、、感觉反馈等具有多种感知能力的交互装置。
  用户界面的发展也历经了批处理、命令行、图形界面三个阶段。自图形界面问世以来,使不懂计算机的普通用户也可以熟练地使用,计算机开始走向大众。于是,用户的需求被空前激发,变得越来越&懒惰&,希望不再通过键盘、鼠标而是通过双手、语言等直接对计算机下&命令&。
  &人类自然形成的与自然界沟通的认知习惯和形式必定是人机交互的发展方向。&微软创始人比尔.盖茨如是说。因此,研究者们也正在努力让未来的计算机能听、能看、能说、能感觉。&过去,一直都是人类去适应计算机,学习计算机语言。&戴国忠说,&未来计算机将朝着适应人类的方向发展,计算机要理解人类的语言和动作。&从计算机发展来看,戴国忠认为有四大趋势,即移动化、平板化、智能化、3D化。
  现实离理想还有多远?
  未来,人类只要通过语言、手势、表情等输入,机器就知道该做什么,这就是人机交互的理想状态。但问题是这样的&人机交互&离我们还有多远?
  实际上,许多改进的人机交互技术已在我们生活中得到应用。触屏技术被视作通往理想人机交互途中的一个节点。以苹果iPhone手机为代表,触屏技术为我们带来了新奇的、简单易用的人机接口,也带来了梦幻般的操控体验。其实,1971年,触摸屏技术已经问世,但是这项技术真正进入百姓生活,却是上世纪90年代。
  目前普遍采用的触屏主要有电阻式、表面电容式、投射电容式、表面声波式和红外线式等5种类型,iPhone用的就是透射。在2007年以前,投射的影响力并不大,正是iPhone以及LG普拉达手机的风靡让这项技术走俏。
  语音成为未来最被看好的人机交互方式。的研究工作可以追溯到20世纪50年代贝尔实验室的Audry系统,此后研究者们逐步突破了大词汇量、连续语音和非特定人这三大障碍。20世纪90年代前期,许多著名的大公司如IBM、苹果等都对系统的实用化研究投以巨资。目前,国内外已经出现了一些商业化的产品,比如语音识别在身份确认上的应用,准确率已经达到99%,一句&芝麻开门&打开房门已经不是传说。
  而体感技术的突破,让我们看到离开键盘、鼠标的希望。玩网球、钓鱼这些游戏时,游戏者要像真打网球那样挥舞手柄。这就是2006年日本任天堂公司推出的家用游戏主机Wii。通过加速度感知与光学定位,Wii遥控器可以准确掌握玩家手持控制器的一举一动。
分享给小伙伴们:
我来说两句……
微信公众账号30新型人机交互技术
上亿文档资料,等你来发现
30新型人机交互技术
盘点当今14种新兴人机交互技术;_zhaokai'blog_百度空间;日期::17:45发布者:未;苹果平板电脑产品;自计算机以一个庞然大物的笨拙体态出现直到现在,它;2008年,微软总裁比尔?盖茨提出“自然用户界面;触摸式显示屏触摸式显示屏在很多领域已经被广泛应用;2007年,微软公司推出了“桌面”(Surfac;而今年6月,“桌面”将
盘点当今14种新兴人机交互技术_zhaokai'blog_百度空间日期: 9:17:45
发布者: 未知
浏览量:9 次
更多企业新闻:企业库 苹果平板电脑产品自计算机以一个庞然大物的笨拙体态出现直到现在,它已经越来越紧密地融入了人们的日常生活,并已经被公认为解决医疗、教育、科研、环保等各类重大社会问题不可或缺的重要工具。在从人逐渐适应计算机再到计算机不断适应人的互动过程中,人机交互技术也不再局限于键盘输入、手柄操作,而是以更加新奇的方式出现:手指的微小动作、声波在空气中的振动、眼珠和舌头的转动,都可以实现信息传递,完成人与机器之间的“对话”。2008年,微软总裁比尔?盖茨提出“自然用户界面”(natural user interface)的概念,并预言人机互动模式在未来几年内将会有很大的改观,电脑的键盘和鼠标将会逐步被更为自然、更具直觉性的触摸式、视觉型以及声控界面所代替。而随着技术的精进,“有机用户界面”(organic user interface)也开始悄然兴起――生物识别传感器、皮肤显示器,乃至大脑与计算机的直接对接,无疑都将给人类的生活带来重大影响。《未来学家》杂志5/6月号刊登的文章,就对当前正在研发或者已投入商用的各类人机交互技术进行了盘点。触摸式显示屏 触摸式显示屏在很多领域已经被广泛应用,最为人熟知的就是安装在机场或者商场的Kiosk自助服务设备,游客或购物者通过手动触摸屏幕,就可以查询相关信息,办理登机手续,甚至购买报纸。2007年,微软公司推出了“桌面”(Surface)计算机,带来了全新的触摸式人机交互模式。这款酷似咖啡桌桌面的平板电脑完全摒弃了鼠标和键盘,通过声音、笔或者触摸就可以完成编辑、浏览图片或者直接订餐等操作。其显示屏隐藏在硬塑料板底下,依靠一套摄像机系统捕捉人发出的指令动作,然后进行分析、理解并加以执行。更令人称奇的是,只要将手机、播放器等物品放到其表面,电脑就能自动识别并进行文件传输。由于“桌面”计算机的屏幕可以分割,并且使用了多点触控技术,可方便多达10个用户同时使用。而今年6月,“桌面”将迎来一个强劲对手,索尼公司计划推出一款名为AtracTable的茶几电脑与之一较高下。AtracTable也可以与放在它表面的手机等设备进行交流互动。另外,该款电脑中还集成了年龄、性别、情绪等分析系统,可以智能识别使用对象。索尼的目标是将之推广到各种使用环境,包括游戏行业、工业、医疗市场和零售业等。柔性显示屏 超薄、超轻的柔性显示屏已经走出实验室,很快就会进入市场“打江山”。很多评论人士认为,使用能够随意折叠卷曲的柔性显示屏制造的电子书就是未来的纸张。
目前电子书阅读器的柔性显示屏有多种类型,其中包括可以主动发光但却会给读者的眼睛带来刺激和伤害的有机发光二极管(LOED)显示屏、需要使用背景光的液晶显示屏(LCD)、以及用在亚马逊Kindle电子书阅读器上的由美国E-Ink公司利用电泳显示技术制造的电子纸。
不同的显示技术之间各有优劣,因而拥有不同的应用市场,比如,LOED显示屏的刷新率更快,而E-Ink公司的电子纸则更加节能。在将来,报纸、杂志甚至服装、墙面都可以变成显示屏,向我们展示一幅幅动态画面。3D显示器 尽管3D电影早在90年前就已经问世,但2010年才算是真正的“3D元年”,索尼、松下和其他厂商纷纷宣布自己生产的3D电视机年内即可上市销售,将3D影像从电影院搬进客厅已是指日可待。目前的3D电视机仍然需要观众佩戴特制的眼镜才可以收看节目。眼镜的规格大致分为主动式快门3D眼镜和偏光3D眼镜两种,并且没有通用的工业标准,由各厂商自行研制。 视网膜显示器的工作原理图虽然产业界认为,近期3D电影在全球票房大卖,预示着家庭市场已经做好了迎接3D的准备,不过,普通观众是否能够忍受连续好几个小时戴着特制眼镜看电视还是个未知数。而据专家预测,无需佩戴眼镜就可收看节目的3D电视机大概还要再等10年左右才会推向市场。
视网膜显示器 视网膜显示器能够通过低强度激光或者发光二极管直接将影像投射到使用者的视网膜上,具有不遮挡视野的特点。这一概念是在20多年前提出的,但直到近些年来技术进步才让各种不同的视网膜显示变得可行。比如边发射发光二极管,其比面发射发光二极管的光输出功率大,但比激光的功率要求低,将其应用于视网膜显示器,可提供一个亮度更高而成本更低的选择。与传统显示器相比,视网膜显示器的亮度-功率比更高,能耗也会相应地大幅降低。视网膜成像的应用前景非常广阔,比如车载平视显示器,可将重要的驾驶信息投射在汽车的前风挡玻璃上,司机平视就可以看到,从而可以提高行车安全;此外还可为执行军事任务的士兵提供最优路径和战术信息,并且在医疗手术、浸入式游戏行业也大有作为。日本兄弟公司曾在2005年的日本“爱知世博会”上展示了全球首款视网膜显示器。该公司最近宣布,计划于今年发布一款使用红光、绿光和蓝光激光二极管的商用视网膜成像显示器。地理空间跟踪 地理空间跟踪的应用潜力才刚刚开始展现,在未来几年中有望取得巨大的技术进步。智能手机配备的全球定位系统、定向仪和加速度计可以提供足够多的信息,来帮助使用者确定大概地点和方向。而技术的改进将有可能使跟踪的精度提高到误差不超出1毫米。很多针对手机开发的现实增强应用,如基于位置的营销、旅游帮助和社交网络等,都使用了地理空间数据,可以提供基于使用者所处方位的关联信息。在未来几年内,随着跟踪定位精度进一步提高以及无线网络进一步提速,这块市场将会大幅增长。 Surface能给人带来全新的触摸人机交互方式,但是索尼将会在自己的设备上加入更多新的技术,例如光学跟踪,可以分析人体的动作和手机,包括身体、手臂、手、手指等等,另外索尼还在设备中集成了年龄、性别、情绪等分析系统,可以智能识别使用对象。动作识别 动作识别是一项正在发展中的技术,在很多方面都可得到应用,如可穿戴式计算机、隐身技术、浸入式游戏以及情感计算(一种可对人类的情感进行侦测、分类、组织和回应的系统或应用,可以帮助使用者获得高效而又亲切的感觉)等。过去大部分动作识别系统重点分析的是脸部和手部的动作,不过现在,研发人员也开始将关注点转移到身体姿势、步态和其他行为举止上来。一些具有动作识别能力的控制设备已经达到了消费者水平,比如任天堂的游戏主机Wii,其主要控制器Wii Remote作为单手操作的遥控器最主要的特色就是其配备了运动传感器,可以对移动和倾斜动作作出判断,将玩家手臂、手腕以及手的动作真实地反映在游戏中,从而与电视荧幕上的虚拟物件产生互动。与此同时,动作识别系统也开始进入医疗领域,医生无需触碰键盘或者屏幕就可以操控数字影像。触觉交互 触觉交互已成为人机交互领域的最新技术,其可借助人的触感,产生一种虚拟现实的效果。触碰可以产生多种不同的感受,包括轻碰、重碰、压力、疼痛、颤动、热和冷,因此人工模拟这些感受的方式也各异。触觉交互技术已经开辟了多种可能的应用领域,包括虚拟现实、遥控机器人、远程医疗、工作培训、基于触觉的三维模型设计等。而在电子商务方面,触觉交互也能够发挥重要作用。比如,顾客在网上购买服装之前,可以先感知一下衣料的质地,然后再做决定。日本东京大学的研究人员正在开发一个被称为“触觉雷达”(Haptic Radar)的项目,通过对使用者周围几米内的环境进行探测,然后将相关信息转换成颤动或者其他感官刺激传达给使用者,从而提高其对空间的感知能力。对于失明的人来说,这种触觉雷达可以让他们在行走过程中避免与身边的人或者物体相撞。随着技术进步,触觉交互最终或许可以让我们拥有之前从未曾体会过的一些感受。可触式(实体)用户界面 可触式(实体)用户界面是自然用户界面的一种,这种设备的奇妙之处在于,它集合了多种功能于一体,比如手机、照相机、遥控器等,并且会随时“变身”,而这完全取决于用户抓握它的方式。麻省理工学院媒体实验室去年推出了一个名为“肥皂块”(bar of soap)的装置,其外形与一块洗衣皂相差无几,但是,如果用户像拿手机一样拿着它,它就会变换出一个带健区的触摸屏;如果像拿照相机一样拿着它,它又会自动转为液晶取景器。其中的奥秘就是“肥皂块”带有的一个三轴加速计和72个表面传感器,可以追踪用户手指位置以及自己所处的位置,然后判断应该“变身”为手机、照相机、遥控器、掌上电脑还是游戏机。而麻省理工学院媒体实验室的另一个发明,是一款与曲奇饼差不多大的计算机,被称为Siftable。其虽然个头小,却同样拥有图形显示、邻域检测、运动感应和无线通信功能。如果将多个Siftable排列组装,就可以实现多种不同的交互应用,比如数学游戏、音乐创作、色彩混合、图片整理或者情节串联图板游戏等,这对激发孩子的学习热情大有帮助。语音识别 能够直接与机器交谈的能力在很多领域都会具有巨大的应用潜力。如果双手可以因语音识别系统得到“解放”,开车,修理发动机,烹饪一道美餐,或者实施一台手术,这些活动都能够从中获益。目前,语音识别技术已经被应用于呼叫路由、家庭自动化、语音拨号以及数据录入等服务。针对国际旅行者的语言对语言翻译器已经开始进入市场,大概再过几年,人们就能买到全球通用的实时翻译器了。无声语音(默读)识别 通过默读识别,使用者不需要发出声音,系统就可以将喉部声带动作发出的电信号转换成语音,从而破译人想说的话。但该技术目前尚处于初级研发阶段。 在嘈杂喧闹的环境里、水下或者太空中,无声语音识别是一种有效地输入手段,有朝一日可被飞行员、救火队员、特警以及执行特殊任务的部队所运用。研究人员也在尝试利用无声语音识别系统来控制机动轮椅车。对于有语言障碍的人士,无声语音识别技术还可以通过高效的语音合成,帮助他们同外界交流。如果这项技术发展成熟,将来人们网上聊天时就可以不必再敲键盘。美国宇航局艾姆斯研究中心正在开发一套无声语音识别系统。研究人员表示,当一个人默念或者低语时,不论有没有实际的唇部和脸部动作,都会产生相应的生物学信号。他们开发的这套识别系统在人体下巴和喉结两侧固定钮扣大小的特殊传感器,可以捕获大脑向发声器官发出的指令并将这些信号“阅读”出来。这套系统最终将会整合进宇航员的舱外活动航天服上,宇航员可以通过它向仪器或机器人发送无声指令。该项目首席科学家恰克?乔金森表示,几年之后,无声语音识别技术就能够进入商业应用。眼动跟踪 眼动跟踪的基本工作原理是利用图像处理技术,使用能锁定眼睛的特殊摄像机连续地记录视线变化,追踪视觉注视频率以及注视持续时间长短,并根据这些信息来分析被跟踪者。越来越多的门户网站和广告商开始追捧眼动跟踪技术,他们可以根据跟踪结果了解用户的浏览习惯,合理安排网页的布局特别是广告的位置,以期达到更好的投放效果。德国Eye Square公司发明的遥控眼动跟踪仪,可摆放在电脑屏幕前或者镶嵌在屏幕上,借助红外技术和样本识别软件的帮助,就能记录用户视线目光的转移。该眼动跟踪仪已在广告、网站、产品目录、杂志效用测试和模拟研究领域进行了应用。由于眼动跟踪能够代替键盘输入、鼠标移动的功能,科学家据此研发出了可供残疾人使用的计算机,使用者只需将目光聚集在屏幕的特定区域,就能选择邮件或者指令。未来的可穿戴式电脑也可以借助眼动跟踪技术,更加方便地完成输入操作。电触觉刺激 通过电刺激实现触觉再现,可以让盲人“看见”周围的世界。英国国防部已经推出了一款名为BrainPort的先进仪器,这种装置能够帮助失明者用舌头来获知环境信息。BrainPort配有一副装有摄像机的眼镜,一根由细细电线连接的“棒棒糖”式塑料感应器和一部手机大小的控制器。控制器会将拍摄到的黑白影像变成电子脉冲,传到盲人使用者口含的感应器之中,脉冲信号刺激舌头表面的神经,并由感应器上的电极传到大脑,大脑就会将感知到的刺激转化成一幅低像素的图像,从而让盲人清楚地“看到”各种物体的线条及形状。该装置的首个试用者、失明的英国士兵克雷格?卢德伯格现在已经能够在不靠外力辅助的情况下独立行走,进行正常阅读,并且他还成为了英格兰国家盲人足球队的一员。从理论上来说,指尖或者身体的其他部位也能够像舌头一样被用来实现触觉再现,并且随着技术进步,大脑所感知到的图像的清晰度将大幅提高。在将来,还可经由可见光谱之外的脉冲信号来刺激大脑形成图像,从而产生很多新奇的可能,比如应用在可见度极低的海域使用的水肺潜水装置。仿生隐形眼镜 数十年来,隐形眼镜一直是一种用于矫正视力的工具,而现在,科学家希望将电路集成在镜片上,打造出功能更强大的超级隐形眼镜,它既可以让佩戴者拥有将远处物体“拉近放大”的超级视力,显示出全息图像和各种立体影像,甚至还可以取代电脑屏幕,让人们随时享受无线上网的乐趣。美国华盛顿大学电子工程系的科学家们就利用自组装技术,使纳米大小的细粉状金属成分在聚合体镜片上“自我装配”成微电路,成功地将电子电路与人造晶体结合在一起。该项目负责人巴巴克?帕维兹称,仿生隐形眼镜使用了现实增强技术,可以让虚拟图像同人的视野所及之处的真实景象相叠加,这将完全改变人与人之间、人与周围环境互动的方式。一旦最后设计成功,它可以把远处的物体放大到眼前,可以让电游玩家仿佛亲身进入到虚拟的“游戏世界”中,也可以让使用者通过只有自己能看到的“虚拟屏幕”无线上网。包含各类专业文献、外语学习资料、幼儿教育、小学教育、行业资料、30新型人机交互技术等内容。 
 但是,计算机科学家并不满足于这种现状,他们正积 极探索新型风格的人机交互技术。 当前语音识别技术和计算机联机手写识别技术 的商业成功让人们看到了自然人机交互的...  数字墨水技术能为人们提供一种新的人机交互界面 ,并以此来扩展人们使用电脑的空间范围 ,但数字墨水不是用来取 代鼠标和键盘的。 用户在使用电脑时 , 就像用笔在...  情感计算――人机交互技术新前景_工学_高等教育_教育专区。课程作业电子信息工程类 张天力 情感计算――人机交互技术新前景 情感计算――人机交互技术新前景 ――摘...  人机交互的革命 未来七大操控技术前瞻(全文)来源: 中关村在线网站( ...尽管这个概念听上去似乎“不靠谱”,但许多大型科技公司都 在尝试开发新型电脑界面...  人机交互技术S_信息与通信_工程科技_专业资料。技术指导 《人机交互技术》 实验指导书《人机交互技术》课程是计算机专业的一门选修课程。人机交互技术的应用 领域越来...  武器装备系统中的人机交互新技术_专业资料。龙源期刊网 .cn 武器装备系统中的人机交互新技术 作者:俞烈彬 孟凡文 来源:《电子世界》2013 年...  多媒体人机交互技术_信息与通信_工程科技_专业资料。第五章 多媒体人机交互技术...5.广义短语结构文法 它起源于转换文法,是一种新型的文法,目前正处于探索中。 ...  人机交互技术_信息与通信_工程科技_专业资料。人机交互新兴技术的看法,大连大学人机交互技术大作业大连大学 人机交互技术新兴技术之谷歌眼镜 班级: 姓名: 2014 年 10...  浅析人机交互技术的发展趋势_专业资料。龙源期刊网 .cn 浅析人机交互技术的发展趋势 作者:宋鸣侨 来源:《现代装饰? 理论》2012 年第 02 ...《人机交互技术》复习重点
重庆大学软件学院03
上亿文档资料,等你来发现
《人机交互技术》复习重点
重庆大学软件学院03
人机交互设计考试资料;完整修正版;试卷题目布局:;i.名词解释;ii.问答;iii.简答题;========================;目录;========================;注:以下粗体标注的问题是考卷中应该会涉及的题目;1.人机交互设计(Human-ComputerI;参考答案一:人与计算机之间使用某种对话语言,以一;参考答案二:人
人机交互设计考试资料完整修正版 试卷题目布局:i. 名词解释ii. 问答iii. 简答题========================================================================目录============================================================================ 注:以下粗体标注的问题是考卷中应该会涉及的题目。 1.人机交互设计(Human-Computer Interaction, HCI)的概念?参考答案一:人与计算机之间使用某种对话语言,以一定的交互方式,完成确定任务的信息交换过程,通过计算机输入、输出设备,以有效的方式实现人与计算机对话的技术,包括机器通过输出或显示设备给人提供大量有关信息及提示请示等,人通过输入设备给机器输入有关信息,回答问题等。参考答案二:人机界面是人与机器之间传递和交换信息的媒介,包括硬件界面和软件界面,是计算机科学与心理学、设计艺术学、认知科学和人机工程学的交叉研究领域。近年来,随着信息技术与计算机技术的迅速发展,网络技术的突飞猛进,人机界面设计和开发已成为国际计算机界和设计界最为活跃的研究方向。2.学习人机交互设计这门课的重要性?参考答案一:人机交互技术是计算机用户界面设计中的重要内容之一,工业机器、计算机;技术、设计、实现;硬件界面、软件界面、可用性、有效性、…与认知学、人机工程学、心理学等学科领域有密切的联系。参考答案二:计算机系统及其应用程序的普及为人机交互学带来了新的挑战,本书全面介绍了以用户为中心的人机界面的设计和评估的方法。采用这种系统的方法不仅可以有效地防止软件产品可用性不高的问题,而且还能帮助设计人员设计出高水平的产品。“以用户为中心的设计和评估”是多学科交叉的新兴领域,对软件工业及一般产品设计都已产生了重大和深刻的影响。3.人机交互与人机界面的区别?人机交互是研究人类所使用的交互式计算系统的设计、实施、评估及相关主要现象的学科,人机界面是人与计算机之间传递、交换信息的媒介和对话接口,是计算机系统的重要组成部分。两个有着紧密联系而又不尽相同的概念:人机界面是人机之间的通信媒体或手段,是人机双向信息交互的支持软件和硬件;交互是人与机-环境作用关系/状况的一种描述。界面是人与机-环境发生交互关系的具体表达形式。交互是实现信息传达的情境刻画,而界面是实现交互的手段。交互是内容/灵魂,界面是形式/肉体。4.自然人机交互主要技术手段?笔式交互技术:汉字与字符识别、数字墨水技术语音交互技术:语音识别、语音合成技术视觉交互技术:生物特征识别技术、唇读、视线跟踪(眼动)技术、人脸表情识别、手语识别与合成5.简要谈谈人机交互技术的发展历史????? 手工作业阶段:
穿孔卡片等,最早的计算机采用 命令方式:
键盘输入,DOS等操作系统采用 图形用户界面GUI: 键盘输入,鼠标,Windows系列采用 多媒体/多模态智能人机交互界面: 手写,语音,图像,多模态…未来系统6.如何实现体显示?7.你觉得智能家庭应该是什么样子的?8.认知心理学的概念?认知心理学研究人类如何获得信息、如何表征信息、如何转化信息为知识、如何储存知识、如何使用知识指导人类行为,以信息加工观点研究认知过程:信息的获取、处理、存储和反馈。9.多通道交互界面多通道交互是近年来迅速发展的一种人机交互技术,它既适应了“以人为中心”的自然交互准则,也推动了互联网时代信息产业(包括移动计算,移动通信、网络服务器等)的快速发展,其中我国科技人员做出了不少优异的工作,多通道的整合问题是多通道交互的一个核心研究内容。1995年由北京大学、杭州大学、中科院软件所承担的自然基金重点项目“多通道用户界面研究”是当时我国最大的HCI项目,探索了多通道用户界面的模型、设计、实现、评估和应用,取得了重要的成果。10.人机交互技术为什么要遵循认知心理学?防止出错、提高工作效率11.传统人机界面设计的缺陷以技术为中心的人机界面、以美工为中心的人机界面。12.ANOTO数码纸笔技术简介瑞典Anoto公司、Ericsson和Time Manager公司共同研发,Anoto技术主要有三个组成部分:数码笔、数码纸、Anoto软件平台。数码纸是通过在普通纸上印刷“点阵”及其他图文内容产生的13.数码纸原理与普通纸不同之处,就是数码纸有“点阵”。“点阵”由一些非常细小的点,按照特殊算法规则排列的组成。点阵的作用是提供给数码笔一个坐标参数信息,保证数码笔在数码上书写时,能够准确的记录书写的笔迹。14.数码笔原理数码笔只是对笔尖所经过的点的信息进行提取、存储和发送的设备,并不对信息进行处理数码笔内存储的信息包括点阵的坐标、书写速度、时间以及压力等信息,基本组成结构:笔芯、高速摄像机、压力感应器、处理器、存储器、电池、通讯单元(蓝牙)。数码笔的基本工作原理如下图所示: 15.文字与字符识别识别文字是人获取信息的主要渠道之一,因而文字识别也是灵境系统中新型人机接口的重要组成部分。字符识别一直是模式识别的重要内容之一,从学科上说,字符识别还涉及到图象处理、数字信号处理、人工智能等;从应用上说,它是信息处理系统中的一种高速自然的输入方式,也是灵境系统、智能计算机接口和多媒体系统的一个重要组成部分16.文字与字符识别分类?按照识别方式分类:①联机/在线字符识别 指用笔在输入板上写,人一边写,机器一边认,可实时人机交互。②脱机/离线字符识别
由扫描仪或其他光电扫描设备将文本转换为图象点阵,然后进行识别按处理对象分类:①印刷体字符识别 ②手写体字符识别③还要分析和识别整个文本的结构和文本上一些非字符信息(表格、图象、公式等)17.汉字识别汉字的字数众多,字型变化丰富而复杂,这给计算机识别带来了巨大的困难,国外汉字识别研究最多的是日本,但是日本的常用汉字只有2000个左右,而我国的常用汉字有6000多个。我国自70年代后期开始相关研究,目前在印刷体汉字识别和联机手写汉字识别方面已初步达到实用,脱机手写汉字识别则离实用尚有距离。18.数字墨水技术数字墨水可以用墨水格式保存,将手写的笔迹以墨水的形式保存,不会丢失任何信息,用户不再需要利用其它的Windows应用程序,来把手绘、手写的笔迹转换为别的格式来保存、发送和编辑,由于Windows平台将“数字墨水”定义为“基本数据类型”之一,这就如同文本得到操作系统这一级别上的支持一样,数字墨水在不同应用软件之间的交换变得非常容易,数字墨水技术已作为产品,结合在微软的Tablet PC 操作系统中,产生了很大的社会影响。它还将继续发展,有可能成为新一代优秀的自然交互设备。数字墨水的处理包括了数字墨水的表示、压缩和显示,墨水智能分析技术,墨水标记和注解技术,墨水的智能操作,墨水存储和搜索。数字墨水与数码笔:数字墨水 + 平板电脑、数码笔 + 数码纸19.麦克风阵列通过在一个阵列中安排多个麦克风,能进一步降低环境噪音,提供更加自然的语音。充分利用通过多个麦克风收集到的关于语音和周围环境的信息,对信号的处理可以有效形成波束以拾取波束内需要的信号,并消除波束之外的噪音。话者定位20.语音交互技术语音识别―Speech RecognitionCCCC语音合成系统话者识别技术C21.语音识别语音识别与合成作为一个独立的研究领域已经有近五六十年历史。语音识别作为一个跨学科的技术,是在人们几个世纪以来对语言学、声学、生理学及自动机理论研究的基础上发展而来的。但这些理论实现起来仍然面临着以下两大困难:不同的说话者有不同的说话方式;在含噪音环境中引入的噪声在很大程度上干扰了原始语音信号;即使对同样一个说话者,随着时间不同,相同词的发音也会不同。由于这些困难,人们就不得不对每一种识别方法加上许多具体的限制,而这些限制也造成了至今仍然很少有实用化的、真正意义上的语音识别系统问世的局面22.孤立词语音识别和连续语音识别孤立词语音识别:最初的研究都是针对孤立词进行的,贝尔实验室1952年研制的数字识别系统是第一个真正意义上的词语识别器(英文数字 ),DARPA语音理解计划,70年代初开始实施。其目标是在研制出能在“理解”连续口语句子、词汇量为1000的基础上,利用人工智能与计算机语言学等知识,把各种类型的知识源如词法、句法、语义等结合到语音识别系统中,即使低层声学识别率很低,高层处理仍能给出较高的识别率。但是,通过深入的研究,人们得到一个经验:理想的语音识别系统中,高层处理固然有益,但低层声学处理也是非常重要的。连续语音识别:主要问题是识别基元的选择与切分 、协同发音现象与上下文 、训练方法。1970年代,语音识别领域在连续语音的识别方面有了重要突破,有代表性的包括IBM小组的工作? IBM Via Voice ,CMU的Baker等人的Dragon System。23.墨尔定律和一分钟现象语音识别的墨尔定律: 演示者在正式演示的时候总是要出各种各样的差错,随着语音识别技术水平的提高,这个定律正在失效。一分钟现象:技术人员演示 ---〉 实际参观者或用户试用,用户对系统的评价基本在一分钟内完成,行还是不行? 一般的过客用户很少有耐性去学会如何使用。24.语音合成技术???? TTS: Text To Speech 参数合成方法 C CCC Holmes的并联共振峰合成器(1973),Klatt的串/并联共振峰合成器(1980), DECtalk(1987), 1990年提出,使合成语音的音色和自然度明显提高 合成语句的语音单元是从一个预先录下的庞大的语音数据库中挑选出来的 由于合成的语音基元都是来自自然的原始发音,合成语句的清晰度和自然度都将会非常高 基音同步叠加(PSOLA)方法 基于数据库的语音合成方法 Speaker Recognition/Identification 不同语言:中文、英语…
孤立词识别系统 连续语音识别系统,HMM,李开复…
IBM Viavoice98 系统p.s. 在语音合成技术的发展中,早期的研究主要是采用参数合成方法。值得提及的是Holmes的并联共振峰合成器(1973)和Klatt的串/并联共振峰合成器(1980),只要精心调整参数,这两个合成器都能合成出非常自然的语音。而最具代表性的文语转换系统数美国DEC 公司的DECtalk(1987),该系统采用Klatt的串/并联共振峰合成器,可以通过标准的接口和计算机连网或单独接到电话网上提供各种语音信息服务,它的发音清晰,并可产生七种不同音色的声音,供用户选择。但是经过多年的研究与实践表明,由于准确提取共振峰参数比较困难,虽然利用共振峰合成器可以得到许多逼真的合成语音,但是整体合成语音的音质难以达到文语转换系统的实用要求。自八十年代末期至今,语言合成技术又有了新的进展,特别是基音同步叠加(PSOLA)方法的提出(1990),使基于时域波形拼接方法合成的语音的音色和自然度大大提高。九十年代初,基于PSOLA技术的法语、德语、英语、日语等语种的文语转换系统都已经研制成功。这些系统的自然度比以前基于LPC方法或共振峰合成器的文语合成系统的自然度要高,并且基于PSOLA方法的合成器结构简单易于实时实现,有很大的商用前景。 最近几年,一种新的基于数据库的语音合成方法正引起人们的注意。在这个方法中,合成语句的语音单元是从一个预先录下的庞大的语音数据库中挑选出来的, 不难想象只要语音数据库足够大,包括了各种可能语境下的语音单元,理论上讲有可能拼接出任何语句。由于合成的语音基元都是来自自然的原始发音,合成语句的清晰度和自然度都将会非常高。25.语音交互技术典型应用汽车声控家电特别是电视机的声控智能交互式玩具信息服务亭… …26.视觉交互设备? 各类摄像设备CC 数码相机,摄像头,监控摄像机,网络摄像机 扫描仪CC 摄像机网络 红外摄像机??? 3D 输入设备CCC27.视觉交互技术? 人脸感知技术CCCCC 人脸检测与识别― Face Recognition 唇读―Lip Reading 表情识别― Expression Recognition 种族、年龄、性别分类/识别 ? 其他???? 人脸合成技术 CCCC 人脸动画Animation、卡通Cartoon、漫画Caricature、老化Aging、表情合成、唇动 Lip Motion 基于视觉的手势识别 人体检测与跟踪 基于视觉的体势识别??C?? 步态识别 ? 虚拟人合成技术 CCCCC 典型应用:手语主持人,体育动作教练,虚拟社区 指纹识别 ? 虹膜识别 ? 掌纹识别 ? 手形识别― 红外温谱28.生物特征识别技术生物特征识别技术(Biometrics)是受到广泛关注的一类新兴识别技术。早期通过对人的指纹识别来确定人的身份,因而指纹识别被广泛应用于安全、公安等部门。随着反恐斗争的日显重要,各国正在对其他人体特征进行广泛研究,希望尽快找到快速、准确、方便、廉价的身份识别方法。人脸、虹膜、指纹、掌纹、笔迹、步态、语音、DNA等的人类特征研究和开发正引起政府、企业、研究单位的广泛注意。29.手语识别和合成?? 中国有2067万聋人,世界有1.2亿聋人 中国科学院计算所研制成功了基于多功能感知的中国手语识别与合成系统1999年CC 连续手语识别 ??30.视线跟踪(眼动)技术? 视线跟踪(眼动)技术由于其可能代替键盘输入、鼠标移动的功能,可能达到“所视即所得”(What You Look at isWhat You Get),因而对残疾人和飞行员等使用有极大的吸引力CC 高质量的眼动跟踪设备 如何构造易于操作的用户界面 它采用数据手套可识别大词汇量(5177个)的手语词 对于给定文本句子(可由正常人话语转换而成),自动合成相应的人体运动数据。最后用计算机人体动画技术,将运动数据应用于虚拟人,由虚拟人完成合成的手语运动。 虚拟人手语合成 绑定的摄像机 视觉传感器,红外 光学传感器(还有压感的、电容的) 生物特征识别技术 步态识别 头势(点头、摇头) 身体状况 人体感知技术 美丽程度 Attractiveness
中医四诊之“望”,面色 Race, Age, Gender…
基于结构光 基于立体视觉 3D激光扫描仪 主动红外 被动红外? 眼动跟踪设备CCC?C? 强迫式与非强迫式 穿戴式与非穿戴式 接触式与非接触式 精度和对用户的限制和干扰
主要问题―尖锐的矛盾 31.模态与多模态交互 模态(Modality)CC?CC???? 源于心理学的概念,涵盖了用户表达意图、执行动作或感知反馈信息的各种通信方法 如言语、眼神、脸部表情、唇动、手动、手势、头动、肢体姿势、触觉、嗅觉或味觉等。
一种使用多种模态与计算机通信的人机交互方式 采用这种方式的计算机用户界面称为“多模态用户界面”
多模态交互(Multi-Modal Interaction) 32.多模态融合交互技术 语音识别+唇读 手语识别+表情+唇读 人脸识别+虹膜识别 指纹+掌纹33.语音和笔作为人类最重要的自然通道――语音和笔的交互技术,包括手写识别、数字墨水、笔交互、语音识别、语音合成等通道技术,近年来已有显著的进步,我国的不少成果已具有国际先进水平,并达到了一定的产业规模。虽然语音和笔(手势)通道因其自身的特点,在抗干扰、准确度等方面仍嫌不足,但它们在多通道整合、领域受限应用等配合下,最有希望成为新一代实用的自然交互技术。34.自然语言理解自然语言理解始终是自然人机交互的最重要目标,虽然目前在语言模型、语料库、受限领域应用等方面均有进展外,由于它的难度(自然语言的不规范性等),自然语言理解仍是计算机科学家和语言学家的一个长项研究目标35.虚拟现实和三维交互设备 36. CAVE系统CAVE系统是一种基于多通道视景同步技术和立体显示技术的房间式投影可视协同环境CCC 该系统可提供一个房间大小的四面(或六面)立方体投影显示空间 多人参与,所有参与者均完全沉浸在一个被立体投影画面包围的高级虚拟仿真环境中,借助相应虚拟现实交互设备(如数据手套、力反馈装置、位置跟踪器等),从而获得一种身临其境的高分辨率三维立体视听影像和6自由度交互感受。 由于投影面能够覆盖用户的所有视野,所以CAVE系统能提供给使用者一种前所未有的带有震撼性的身临其境的沉浸感受。37.触觉通道的力反馈装置新一代力反馈感应技术主要有CCCC38.体三维显示?? 真正能够实现动态效果的3D技术 CCC “悬浮”在半空中的三维透视图像
扫描体显示 (Swept-Volume Display) ?? 代表作是Felix3D和Perspecta
代表作则名为DepthCube
固态体显示 (Solid-Volume Display) 体三维显示技术目前大体可分为 TouchSense触觉感应技术,主要用在鼠标/轨迹球等产品中 G-Force Tilte动作感应技术,则主要用在动感游戏控制器中
由MIT人工智能实验室Massie and Salisbury开发、美国SensAble公司生产及其Ghost软件开发包 用在非游戏的高精度触觉反馈装置中,已广泛用于军事、医学、机器人、教学、虚拟现实等各类应用中。 Phantom触觉反馈设备(6自由度)包含各类专业文献、高等教育、行业资料、应用写作文书、幼儿教育、小学教育、外语学习资料、《人机交互技术》复习重点
重庆大学软件学院03等内容。 
 《人机交互技术》复习重点... 24页 10财富值 重庆大学软件需求复习重点 6页 ...重庆大学应用化学《表面工程》期末考试复习重点,正考补考的试卷都在这里面出!重庆...  重庆大学试卷 教务处 07 版 第 1 页共 2 页 重庆大学《数值计算》课程试卷
学年开课学院:数统学院 课程号: 第 1 学期考试日期: 考试时间 120...  《人机交互技术》复习重... 24页 4下载券 重庆大学2011年春季学期... 3页 2下载券 重庆大学建筑装饰施工复... 暂无评价 51页 免费 重庆大学电气工程学院《....  重庆大学微观经济学复习讲义_研究生入学考试_高等教育...学院所有专业 课程教材:黎诣远, 《西方经济学》 (...?技术:生产投入量和和产出量之间存在一定的关系,...  人机交互技术实验指导书 山东大学计算机科学技术学院,齐鲁软件学院 《人机交互技术》课程 实验指导书 山东大学 计算机科学技术学院 齐鲁软件学院 第 1 页共 51 页 ...  人机交互技术_实验大纲_营销/活动策划_计划/解决方案...大纲执笔人:刘云安 大纲审定人:数字媒体学院学术...[1]《人机交互基础教程》(第 2 版)(重点大学...  重庆大学软件学院党员发展程序及说明_党团建设_党团工作_应用文书。重庆大学 软件...可参见《各年级段党员发展工作主要任务简要介绍》 ,详见附件5。 3、入党申请书...  重庆大学软件学院是由国家教重庆大学软件工程硕士自主...培养具有扎实的软件 技术和软件工程技术基础、软件...七、学位授予 修完我校《工程硕士研究生培养方案》...  重庆大学《表面工程》重点 暂无评价 6页 免费 《人机交互技术》复习重点... 24页 10财富值 重庆大学软件需求复习重点 6页 1财富值喜欢...

我要回帖

更多关于 人机交互 家电 语音 的文章

 

随机推荐