知道有名画、珠宝等的鉴定师,没想到吻戏也有鉴定师!顿时有些不解,这吻戏鉴定师是干嘛的?难道吻戏要经过他们的鉴定?疑惑很多,接下来,便与你一起来揭开这神秘的面纱,一起看看去。
今年29岁的吉恒杉的就是一名吻戏鉴定师,他每天的工作基本上是端坐在电脑前,手指轻轻点击鼠标,将屏幕上成百上千幅内容各异的画面标注成两类——“接吻”和“非接吻”。作为优酷的一名人工智能标注员,他正在训练机器识别何为“接吻”镜头。
据悉,吉恒杉也是高学历的学霸,他毕业于北京航空航天大学,硕士学的是计算机视觉,通俗地讲,这个专业的目的是“教电脑看懂世界”。去年9月他加入优酷成为一名高级算法工程师,目前的主要工作是教计算机识别接吻、牵手等场景,也被称为“吻戏鉴定师”。
吻戏鉴定师是干嘛的
吉恒杉透露,他起初和女友说自己的工作的时候,女友的反应有点大,觉得不可思议,说道“谁给钱你让你干这个呢?”但后面也是慢慢的理解了。吉恒杉说“这个岗位正好和我的专业吻合,给大家传递快乐和幸福,又能以工作的名义看网剧,我特别喜欢。”
10年来,中国网络视频内容消费用户达到近6亿。“身边越来越多的人用手机和电脑看网剧、电影和体育比赛,每次上下班坐地铁,都能看到有人拿着手机、带着耳塞看视频。”吉恒杉发现,大家的需求不再是简单地看剧,还想看更精彩有趣的片段、集锦,更主动地找到自己最想看的明星或者场景。
要想实现搜索和智能编辑,就得训练机器从海量的素材中找出相应的场景,并打上标签,就像从茫茫海洋中挑出螃蟹和海龟。男女主角的“吻戏”传递出美好和幸福,一般是剧情发展的高潮,因此成为剧集中最常见的标签,如何教机器识别接吻成了吉恒杉和同事们首要的难题。
吻戏鉴定师团队
这项看上去高冷的人工智能黑科技,在最初的环节真的需要不少“人工”。吉恒杉从图片库和视频中截出数千幅图片,从中一张一张标注出“接吻”的画面。这个过程叫做“数据标注”。“一天要标注几百张接吻的图像,最多时标注上千张,盯着电脑屏幕看一天,最后都有点麻木了”吉恒杉说。
通常数据标注得越准确、数量越多,模型的效果就越好。自然,机器识别的效果就会更好。比如,为了拍出唯美画面,“接吻”这个姿态也千差万别,有的深情对视,而有的若即若离,团队里的“吻戏鉴定师”们不得不打印出角度各异的“接吻”画面贴在墙上,一群人激烈讨论到底怎么才算“接吻”。
“吻戏鉴定师”是个技术活,需要根据机器的反应进行繁琐的后期调试。机器学习了上千幅图片中的特征,这时再给机器任意一张“接吻”的画面,它就能认出来了。截至目前,吉恒杉和同事们已经为2万多条“吻戏”打上了标签。
吉恒杉所在的团队目前有8个人。随着业务的快速拓展,“吻戏鉴定师”们也开始接触和研究其他场景,比如哭戏、打戏,接下来还要鉴定体育比赛中的射门、扑球、投篮、庆祝等画面,以便网站小编制作比赛精彩集锦。他们不光要看图片,还要时常“探班”,到比赛或节目现场去观察和体会每个场景、动作的细小差别。
目前,5分钟时长的视频全链路处理可在10秒内完成。比如剧集《三生三世十里桃花》,每一集50分钟的视频被切割成3000帧图片,机器只需要5秒就能挑出来杨幂和赵又廷的吻戏。
这几年娱乐圈出现了一些新现象,就比如说是明星撞脸的现象,如何训练机器识别古力娜扎和迪丽热巴,如何分辨TFBOYS的“三小只”,需要不断试错和反复进行模型训练。区分“明星脸”“网红脸”“双胞胎”,成了吉恒杉和同事们面临的新挑战。