Skip to content

Recruitment

Guan Wang edited this page Nov 24, 2017 · 1 revision

中文文本标注工具Chinese-Annotator,是一个集合了前后端开发和NLP算法开发的富有挑战性的全栈开源项目。 万事开头难。前期的开发需要核心团队协同完成,我们需要你的帮助!

  1. 程序架构:

程序框架开发,与前后端及算法模块紧密沟通,定义函数功能,规范接口和参数。 我们希望参考rasa_nlu的用户配置设计将通用算法模块和用户数据隔离开,同时参考iepy的前后端设计和算法尤其是active learning部分的设计。

  1. 前后端开发:

前端使用vue+flask构架全栈开发,完成web用户中文文本标注的动态交互。后端业务逻辑支撑和可扩展的数据持久化。

  1. NLP算法模块开发:

传统NLP特征工程,传统分类(SVM)和序列标注(CRF,HMM)算法开发,深度学习NLP的分类和序列标注算法开发。online及offline算法优化,以及接口API开发。

  1. Python工程师:

Python代码开发。