网站首页 > 产业安全> 文章内容

一本开源的NLP入门书籍

※发布时间:2019-9-6 6:33:57   ※发布作者:habao   ※出自何处: 

  测试你前世怎么死的图像、文字和声音是人类接触、理解外部世界最常见的三种形式,其中文字又是最容易保存和进行交换的形式。大量的人类文明,最终都是以文字的形式保留下来的;大量的信息交换,都是是文字的形式进行。如何能让机器可以与人交流,理解人类的思想,最终能像人类一样理解文字以及文字背后的各种想法、意图呢?自然语言处理,即所谓的NLP是重要的支撑技术。

  在传统的web攻防中,大家与http协议结下了不解之缘。但是在安全领域,web攻防只是很小一个分支。许多明显的与工作和生活无关的垃圾邮件,人一样就可以看出来,但是基于规则的垃圾邮件网关处理起来却总是差强人意。越来越多的电商、论坛甚至是视频网站的弹幕,总是可以看到明显的人身或者违法违规信息,但是基于规则的过滤机制总是被绕过。人类可以很轻松的理解二十四换机,知道苹果是水果还是手机,但是机器如何做到呢?答案就是NLP。

  之所以想用开源的思去写,主要是因为NLP技术,尤其是基于机器学习的NLP技术发展非常快,比如目前已经广泛使用的sttext技术,2016年发布论文,2017年已经进入大量生产领域,但是许多自然语言处理书籍还停留在大学课程的范围,甚至连词向量都很少涉及。相对周期繁琐的纸质书籍编写,在Github上我可以很方便的进行编写和更新,有勘误也可以很快修改。目前我已经完成了其中的三篇,后面我将不断更新内容。

  财成国际

关键词:安全书籍
相关阅读
  • 没有资料