Ubicación: Madrid (Modelo presencial preferente con alta flexibilidad a negociar)
Compensación: 70.000 EUR - 90.000 EUR brutos anuales + Equity fundacional significativo
https://jobs.ashbyhq.com/naiian/aebbf702-9dc6-4ed2-bd3c-34608aaabef1
Sobre NAIIAN y el Reto
NAIIAN es una startup Deep Tech europea con financiación sólida y equipo fundador en Madrid. Construimos una plataforma cloud con IA aplicada para clientes que operan en contextos de alta exigencia operativa y decisional. Sabemos que la calidad de la IA dependerá de la calidad de los datos, documentos, fuentes y trazabilidad que la alimentan.
Buscamos a nuestro Founding Senior Data Engineer para construir la capa que hará que la IA sea confiable, verificable y defendible, no solo llamativa en una demo. Tendrás ownership real sobre la base de datos y conocimiento de la compañía, trabajando muy cerca de Applied AI, el CTO y el equipo fundador.
Nuestro enfoque sobre el trabajo en equipo:
Creemos firmemente en la magia que ocurre al estar codo con codo frente a una pizarra durante esta fase crítica de 0 a 1. Por eso, nuestro escenario ideal es contar contigo en nuestra oficina de Madrid.Sin embargo, sabemos que el talento excepcional requiere flexibilidad.Si eres la persona adecuada, nos sentaremos a diseñar un modelo de trabajo (híbrido o de presencialidad concentrada) que se adapte a tu vida y a los objetivos de la compañía.
¿Qué impacto tendrás?
Pipelines e Ingesta: Diseñarás pipelines de ingesta para múltiples fuentes estructuradas y no estructuradas.
Procesamiento Documental: Construirás la capa de parsing, OCR, normalización, deduplicación, versionado y extracción.
Fundaciones RAG e IA: Prepararás datos para retrieval, búsqueda híbrida, embeddings y AWS Bedrock Knowledge Bases.
Calidad y Trazabilidad: Diseñarás data quality checks, lineage, trazabilidad de fuentes y mecanismos de auditoría para asegurar que el producto no pierda confianza.
Colaboración Operativa: Colaborarás con backend y cloud para exponer datos de forma segura, versionada y multi-tenant.
¿A quién buscamos?
Track Record: Tienes experiencia construyendo pipelines de datos, conectores o plataformas documentales en producción.
Core Técnico: Cuentas con experiencia sólida en Python, SQL, PostgreSQL y procesamiento de datos (estructurados y no estructurados).
Dominio RAG/Search: Posees conocimiento práctico de search, retrieval, embeddings, vector stores o búsqueda híbrida.
AI-Driven: Tienes experiencia o ganas reales de trabajar con coding agents (Codex, Claude Code, Gemini o equivalentes), usando specs y revisión rigurosa.
Suma Puntos: Has trabajado con corpora documentales complejos en español, has construido datasets/golden sets para sistemas de retrieval, conoces el information retrieval clásico (BM25), o vienes de sectores con datos sensibles (legaltech, healthtech, fintech, compliance).
El Stack Tecnológico
Valoramos experiencia equivalente y criterio para construir bases de datos fiables:
Lenguajes: Python (Django, FastAPI o Flask para servicios de datos o APIs internas) y SQL sólido (imprescindible).
Data Store: PostgreSQL (ideal); experiencia con warehouses, lakes o lakehouses suma puntos.
Knowledge / RAG: AWS Bedrock Knowledge Bases, pgvector, Elasticsearch/OpenSearch, Qdrant, Weaviate, Pinecone, Vespa o búsqueda híbrida.
Pipelines / Messaging: Airflow, Prefect, Dagster, SNS/SQS, Kafka, RabbitMQ o equivalentes.
Data Quality / Developer Workflow: Tests, lineage, observabilidad funcional, y uso de herramientas como AGENTS.md , Skills/SKILLS o OpenSpec/Spec Kit.
Nuestro Compromiso Contigo
Salario Competitivo: 70.000 EUR - 90.000 EUR brutos anuales, según experiencia.
Piel en el Juego: Equity fundacional significativo, diseñado para que el upside importe.
Setup de Alto Rendimiento: MacBook Pro a elección, pantalla Dell de 40", teclado/ratón a elección y silla Herman Miller (o equivalente).
Cuidado Personal: Seguro médico y ticket restaurant.
Autonomía Total: Ownership real sobre la base de datos, documentos y conocimiento, con alta velocidad de decisión.
Protección de datos
Los datos personales que nos compartas durante el proceso (CV, datos de contacto, información profesional, comunicaciones e información aportada en las entrevistas) serán tratados por Naiian con la finalidad exclusiva de gestionar tu candidatura para este puesto y, si das tu consentimiento expreso, para futuros procesos de selección compatibles con tu perfil. La base jurídica del tratamiento es la aplicación de medidas precontractuales a petición de la persona interesada (art. 6.1.b RGPD) y, en su caso, tu consentimiento (art. 6.1.a RGPD).
Tus datos se conservarán durante el tiempo necesario para gestionar la candidatura y, salvo que ejerzas tu derecho de supresión, hasta un máximo de un año si autorizas su conservación para futuros procesos. No realizamos decisiones automatizadas con efectos jurídicos significativos. Puedes ejercer en cualquier momento tus derechos de acceso, rectificación, supresión, oposición, limitación y portabilidad, así como retirar el consentimiento, escribiendo a la dirección de contacto que aparece en el formulario de aplicación. Tienes derecho a presentar una reclamación ante la Agencia Española de Protección de Datos (www.aepd.es).
— Naiian Recruiting Team