AI Researcher – Multilingual Data

featherless.ai - Remoto 🌎

featherless.ai

Salary: $$$
Type: Full time

Tags: Full Time Python PyTorch JAX benchmarks multilingües (XTREME FLORES

📌 Rol: AI Researcher – Multilingual Data

🌎 Ubicación: 100% remoto (Worldwide)

💼 Tipo de Contrato: Full-Time

🎓 Formación: No especificado


📋 Descripción General

Buscan un/a AI Researcher enfocado/a en datos multilingües para investigar, escalar y llevar a producción modelos de lenguaje en múltiples idiomas, incluyendo low-resource languages. El rol combina research de frontera, prototipos y aplicación real en sistemas productivos, con fuerte énfasis en publicación académica y ejecución en entorno startup.


📋 Responsabilidades Principales

• Diseñar y ejecutar research sobre datasets multilingües (recolección, filtrado, deduplicación y métricas de calidad).

• Desarrollar estrategias para low-resource y long-tail languages.

• Investigar cross-lingual transfer, alignment y robustez en LLMs.

• Construir y mantener benchmarks de evaluación multilingüe.

• Colaborar con ingeniería en training pipelines y decisiones de arquitectura.

• Publicar research en conferencias top y traducir hallazgos a mejoras en producción.


🎯 Requisitos

• Background sólido en NLP/ML con foco en modelos multilingües o cross-lingual.

• Publicaciones en conferencias/journals reconocidos (ACL, EMNLP, NeurIPS, ICML, ICLR, etc.).

• Experiencia con datasets de texto a gran escala en múltiples idiomas.

• Conocimiento en tokenization, data quality, bias y transfer learning.

• Capacidad de prototipar en Python con frameworks modernos.

• Autonomía y ritmo de ejecución tipo startup.


🏖️ Beneficios

• Ownership real sobre la dirección del research.

• Balance entre papers y producción.

• Acceso a datasets grandes e infraestructura moderna.

• Compensación competitiva + equity significativa en etapa temprana.

Source: WeRemoto | Main Category: Other