翟成祥:成功要有理想、热情和决心

2018-09-10 09:37:09来源:泰州日报作者:本报记者 张翠红

  1965年出生,兴化市戴南镇人。美国伊利诺伊大学香槟分校计算机系Donald Biggar Willett讲席教授,并在该校生物信息研究所、信息科学学院及统计系任兼职教授,国际计算机学会(ACM)会士。1990年、2002年分别获得南京大学计算机博士学位和卡耐基梅隆大学语言和信息技术博士学位。他提出和开发了大量用于信息检索和文本挖掘的有效通用算法,包括一套以用户为中心的适应性检索算法及一个智能个人化检索软件,能帮助用户更有效地在万维网上寻找有用信息。

  

  采访翟成祥教授,是在兴化戴南镇老家。记者进门时,平时难得回家的翟成祥,正在陪70多岁的老父亲翟仁才对弈围棋,他没有立即起身,而是轻声征求父亲意见“要不要封棋?”父亲自然同意,他这才移座接受采访。

  14岁走进南大,本硕博连读

  记者:恢复高考,很多人的命运因此改变。用现在流行的说法,当年您是个学霸,以戴南中学最高分被南京大学计算机系录取,请您谈谈当时的情况。

  翟成祥:印象中,当时高考总分530分,我考了428分,另外,20分的数学附加题我得了18分。我从小喜欢数理化,高考时我语文、政治都仅考了60多分。一个人的发展方向在于他的兴趣点和价值观,如果我早些发现语文比较重要,那么我也会多花一些精力在上面。每个人实际能做到的,远比你想象的要多得多,千万不能用所谓的可行性来限制自己的思维。

  记者:在上世纪七八十年代,计算机是个新鲜事物,大多数人听都没听说过,感觉很遥远,可您是1980年考入南京大学计算机系,还读了计算机博士。为何想到报这个专业?

  翟成祥:确实是这样,计算机是个很好的专业。现在回头看,当时是新鲜产业,如今也已经应用到方方面面。不过那时小学到高中共九年,高考时我才14周岁,并不了解计算机,报考这个是父亲为我做的决定,为此,我要感谢我父亲。父亲当时看到我数学方面的优势,本想给我填报南大数学系,后旁人提醒,报什么专业得考虑孩子的兴趣。兴化中学一名资深的数学老师告诉我父亲,刚进数学系,解出一道道难题的确很有成就感,但往后会越学越枯燥。父亲听从他的建议,为我选报了跟数学相关的计算机系,使得我成为南大计算机系招收的第三届学生。

  记者:您认为改革开放对于您个人成长而言,意义何在?

  翟成祥:可以说,是改革开放给我创造了进入南京大学读书的机会,南大领先的优秀教师队伍和环境条件,让我接受了计算机科学方面的严格训练,先后在南大读了本科、硕士、博士,从而打下了扎实的知识基础。读博期间,我有幸师从著名计算机科学家徐家福教授,于1990年完成关于计算机自动汉语理解和分析方法的博士论文,获得当时为数不多的计算机软件博士学位,为今后的研究和教学奠定了基础。(下转08版)

  (上接01版)整个成长过程都受益于国家的改革开放政策。毕业后留在南京大学计算机系任教。1993年与导师徐家福教授及师兄王志坚(现任河海大学教授)合著了一本关于对象式程序设计语言的教科书,填补了当时中文教材这方面的空白。

  走出国门,学习前沿技术

  记者:您在南京大学学习10年,1993年决定赴美,到卡耐基梅隆大学计算机学院攻读语言信息技术博士学位,当时支持你出国的想法是什么?

  翟成祥:做研究的目的,就要在学术界的前沿发现未知,但当时国内条件存在种种缺陷,最大的缺陷是经济条件原因,科研经费不足。当时我同事都说,人家是坐在高椅子上做学问,而我们是坐在地上搞研究,起点就要比人家低很多。比如,国外一个专题的最新研究结果在会议上公开交流后,有限的学术文集传入国内有个过程,整个南大很可能只有一本,教授、副教授、研究生等依次阅读,从而很难及时和全面了解学术界最前沿的结果,造成我们的研究不够有效,也给深化研究带来较大障碍。所以当时我就想,要想真正有所创新,必须走出去,接触世界前沿技术。

  大数据技术范围很广,涉及几乎所有计算机的方面,但在其中的数据分析、信息检索方面我可能算出去比较早的。

  信息检索属大数据应用,最早应用于图书馆,而万维网出现后,人们每天接触的信息量非常大,如何快速找到自己想找的信息,直接关系到人们的工作效率。当时我在南大拿的第一个博士,学习和研究的方向偏向软件工程方面。后来到卡耐基梅隆大学计算机学院攻读语言信息技术博士学位,集中到自然语言理解和信息检索方面,就是让计算机对自然语言有一定理解,以便帮助人快速准确检索信息。

  记者:您的新型信息过滤算法获得5项美国国家专利,2002年您又开发了一种新型的语言模型平滑技术及新型的检索技术,这些技术已被公认为最有效的检索模型之一。您的检索法优势在哪?

  翟成祥:当时已有的检索算法比较多,无一最优,如何开发最优的检索算法是一大难题。我的研究涉及多方面,其中一项的优势是,把统计学结合到排序算法里,推导出有一定理论基础的新型高效检索算法。另一项是利用人的交互信息优化检索结果,使搜索结果能针对每一个特定用户进行优化。

  记者:您有三篇关于统计语言模型的论文被国际信息检索专委会先后评为10年最有影响优秀论文奖,您现在的研究方向是什么?

  翟成祥:我早期主要研究信息检索,现在更偏向大数据。信息检索是帮助人联系、收集有用信息,但这种检索系统不帮助人消化信息,也就是只帮助你找到产品,并不给出产品正负面意见和对产品比较分析。后来我开始做数据挖掘、文本分析以帮助人消化检索找出的相关信息,比如对文本数据的观点、舆情、主题、信息可靠性、自动摘要、自动比较、趣事进行分析等。

  现阶段将非文本数据和文本数据加在一起做,更全面地研究大数据应用,以支持人的决策,为比较复杂的任务提供帮助。

  记者:泰州有医药高新技术产业园和数据产业园,大数据可应用在哪些方面?

  翟成祥:大数据的应用很广泛,可以应用于许多领域,包括医疗、金融、教育、安全等等。研究人员的最高理想是将研究成果落地应用,目前我和北京、南京等地多家医院均有在医疗大数据方面的合作。将大数据转化为人工智能,可用于疾病诊疗、药物研发、康复保健等多方面;建立电子病历、通过智能助手帮医生精准治疗;通过数据分析,捕捉药物的副作用,产生预警;将中医保健知识进行传播分享等。

  成功要有理想、热情和决心

  记者:在戴南,您是传奇人物,大家提到您,都像讲故事一般。您求学和科研路上的感悟有哪些?

  翟成祥:要想成功,勤奋毋庸置疑,但我觉得不光是勤奋,还需要有理想、热情和决心。树立有价值的理想与目标最为重要,因为人们所说的勤奋、热情以及决心,都源于你看到的目标的价值;只有真正看到了价值,你才不放弃,并持续为之努力。

  打个通俗的比方,大家直奔北京故宫旅游,都认为故宫是第一旅游目标,但若半路上雨越下越大,前进遇到了很大困难,有些人就会思考要不要去的问题,也许有人提议附近有个博物馆,去游玩也不错,于是他们放弃第一目标求其次。但也有另一些人,他们去故宫的目的除了旅游,还有某种对他们有特殊意义的价值,这些人就会思考“怎么去”,而不是考虑“要不要去”,而怎么去方法层出不穷,他们作出努力后,就能解决前进道路上的障碍,最终实现最初的第一目标,这就是价值观的力量,跟智能、智力关系不大。

  起初我做计算机研究也是对计算机真正感兴趣,不是迫于压力而做,可后来我认识到,我的理想是让我做出的研究成果有价值,价值体现在社会是否需要,能否改变世界,全世界多少人在用?这种思维影响了我后期对研究方向的选择。我在做研究的同时也一直在做老师,希望让所有被我教过的学生受益,让他们从对知识的不了解到了解,这是我看到的另一方面的价值所在。真正有价值的目标,是让我们能解决前进道路上一个又一个障碍的永恒动力。

  寄语年轻学子,认准人生目标

  记者:泰州是教育之乡,每年升入高等学府的学子众多,单今年高考就有26名学子问鼎清华、北大。他们现在走的路,就是您当初走过的,您对泰州年轻学子有些什么建议?

  翟成祥:如果让我建议,我依然强调抱负、价值观。年轻人要认准自己的人生目标,在社会上发挥好的作用,要明确能给你动力去克服种种困难的方向在哪儿。不妨想一想,如果让人生前进20年,我希望达到什么目标,现在所做的都是为将来实现长远目标而准备。

  当然制定的目标要考虑社会需求,要能给社会带来影响和效益。比如企业家要给社会贡献产品,教育者要给学生提供知识。再次,也要考虑资源,也就是在制定目标时,考虑到如何能利用自身资源,联合别人或引导别人,使达到目标的劳动最小化。从思考我一个人能做什么,扩大到思考大家一起能做什么,你的目标如果符合社会需要,就会成为大家的目标,从而放大了价值。

  一旦找到你认定的最有价值的目标,就不要轻易放弃,制定计划,克服前进道路上的种种困难,就一定会在你所从事的研究或创业等领域发挥出你的最大潜力,作出对社会有价值的成绩。