分类: 我爱CFan |

复眼相机——重建三维画面
北京/王哲
近期,日本大阪大学的研究者开发出一种可以通过分析画面中的三维信息来辨识物体的超薄照相机,它可以测量画面中两个物体之间的距离,还可以检测出物体的颜色和结构特征。实际上,这个由Jun Tanida领导的研究小组,已经建立了一套完整的硬件和软件系统,来辨识物体并重建三维画面。
据Tanida介绍,这项被称作TOMBO(束缚光线下薄观测模块)的技术,实际上是以生物学成像系统中的昆虫复眼为设计蓝图的。TOMBO的硬件部分由9个可调节的小镜头组合而成,当研究者将其装入一个钮扣大小的盒子里时,随着把镜头调节地越来越小、越来越薄,TOMBO的软件部分就能够模拟昆虫,辨认物体的位置、形状和颜色,并以此来分析图像。这样的复眼照相机可以在手机一类的设备中,提供更强大的获取和辨认图片的功能。
由多个镜头组成的“复眼”,可以利用微小的角度差距来获取图像信息,就好像我们的双眼观看物体是从两个不同的角度一样。当一个人观看某个物体时,两眼视线的夹角取决于这个物体离人眼的距离。并且,影响人对物体的颜色和形状感官判断的微小差别,很大程度上取决于是用哪只眼睛在看,以及光源在什么地方。本质上说,我们的大脑通过比较双眼看到的景物,来推算距离、颜色和形状。
同样的理论也被应用于TOMBO的软件部分的图像识别算法。该软件将9个小画面分开,移除阴影,补偿失真,在一个单独的二维画面中重测图。在重测的过程中,在各个镜头得到的画面中找出不同处并积累运算,就可以析取物体的距离、颜色和形状,从而得到一个重建的三维图像。
其实,近些年来,很多研究者致力于研究照相机中的复眼镜头。但是,与该领域中其他研究者不同的是,大阪大学的研究小组把关注的焦点放在了将设备做成超薄的,这样就可以将它应用于一些对照相机薄厚程度要求较高的领域。例如,一个像TOMBO一样很薄的图像辨识系统,就可以很安全地应用于飞行器的翅膀上,用于监视却不会增加太多重量。
歌声搜索—通过哼唱就能找到歌曲
北京/王哲
你总会碰到这种情况:反复的哼唱某段旋律,希望能想起这是哪首歌。而当你唱给朋友听时,他甚至无法辨识出你走调的旋律。不过现在你不用觉得没面子了。一个新网站Midomi.com可以帮你找到你要的歌曲,只要你对着麦克风哼唱,它甚至可以自动纠正你曲调的错误。
据Midomi的创造者Keyvan Mohajer介绍,目前的音乐搜索技术大大落后于文字搜索技术,一部分原因是后者被认为是一项更为重要的业务,因此更多的人愿意付出精力去研究。而且,任何种类的声音——音乐、人声或者其他——都是很多复杂信号的集合,因此很难用计算机进行分解和归类。但是随着个人和商业数字音乐图书馆的兴起,对音乐搜索的需求也在增长,即使没有办法对所有种类的音乐进行分析,研究者们和例如Midom这样的公司也在尝试使用可行的商业化音乐搜索。
Midomi是最早开始音乐搜索业务的公司之一。当使用者进入Midomi网站后,他们可以对着麦克风哼出一段旋律。站点会将这段旋律与记录了所有哼唱旋律的数据库中其他使用者哼唱的旋律进行对比。如果找到匹配的,就会提供一个原版歌曲的片断,同时提供完整歌曲的收费下载。使用者还可以听到其他使用者演唱的版本。实际上,另外几家公司也解决了音乐搜索的难题,但是这些公司却还不能根据哼唱出来的旋律进行搜索。
该公司的雄心壮志是“建设世界上最全面的可搜索音乐数据库”,Mohajer说道。达到这个目的的最好办法,就是依赖用户。在Midomi,使用者可以寻找他们想唱的歌曲的名字,记录他们自己的演唱。目前数据库增长得很快。你也不妨试试吧。