Сложные задачи с хорошей зарплатой. Команда профессионалов
Карьера
-
Специалист по анализу данных (Data Scientist)
Requirements
- Опыт работы с алгоритмами обработки естественного языка и машинного обучения
- Понимание концепций и этапов работы с большими данными в реальном мире, от понимания проблем, связанных с конкретной областью, подготовки данных, обработки данных, связанных с поездками, интеграции данных, структур данных для машинного обучения, моделирования данных и алгоритмов AI/ML; сильные знания и навыки в области разработки программного обеспечения и науки о данных.
- Опыт кодирования и отладки нейронных сетей глубокого обучения для обработки текста в PyTorch, Keras и/или TensorFlow
- Опыт работы с Perl, Python или другим скриптовым языком; использование командной строки
- Знание на высоком уровне различных методов машинного обучения и ключевых параметров, влияющих на их эффективность
- Экспертные знания различных аналитических инструментов и методов с умением их использовать
- Выдающиеся навыки программирования и статистического моделирования
- Понимание распределенных файловых систем, масштабируемых хранилищ данных, распределенных вычислений и связанных с ними технологий (Spark, Hadoop и др.); опыт внедрения методов MapReduce, обработки данных в памяти и др.
-
Computational Linguist
Requirements
- Degree in Computational linguistics
- Fluent in one of the following languages: Chinese Traditional, Cantonese, Mandarin, Italian, Japanese, Portuguese, German, French, English
- Excellent knowledge of structural aspects of the language (syntax, semantics, phonology, phonetics)
- Strong linguistic comprehension
- Experience in some of the following areas: text processing and construction of corpora in unfamiliar languages; processing of large text collections with standard NLP tools for parsing, entity extraction, POS tagging, topic discovery and classification (such as sentiment analysis), and natural language understanding; tuning hyper-parameters of existing NLP models for domain-specific data sets; computational manipulation and analysis of natural language documents using statistical models; experimenting with large corpora for developing and testing advanced NLP algorithms
- Previous working experience with language data (e.g. research, analysis, translation, review)
- Ability to program in Python, Perl, or other scripting language; comfort with work in a Linux environment
- Familiarity with common NLP and ML toolkits such as Stanford CoreNLP, OpenNLP, NLTK, scikit-learn, and Tensorflow
- Experience using OS X or iOS software is a plus
- Ability to analyze and assess software development or data acquisition requirements and determine optimum, cost-effective solutions
- Good organizational and analytical skills
- Excellent English language skills, other language skills are appreciated
- Strong communication skills, attention to details, and proven ability to manage priorities
- An ideal candidate has experience and passion for working with language data and developing natural language processing code specific to the native language
What you will do:
- Develop new applications of natural language processing
- Collect, curate, and analyze natural language corpora for a variety of NLP and text analytic tasks
- Perform metrics-based evaluations of new technologies from research organizations to determine potential contributions
- Work closely with software developers, senior investigators, program managers, researchers, and data analysts to design and optimize a software platform to produce and analyze results, disseminate findings, and contribute to publications and presentations