Question 1

¿Qué es un token?

Accepted Answer

Es el pedacito en que una IA parte el texto para procesarlo: puede ser una palabra, un trozo de palabra o un signo. Los modelos no leen letras sueltas, leen tokens, y cobran por token (de entrada y de salida). Por eso entender cuántos tokens ocupa tu texto te dice cuánto costará y cuánto contexto cabe.

Question 2

¿Por qué el español gasta más tokens que el inglés?

Accepted Answer

Porque los tokenizers se entrenaron mayormente con texto en inglés. Las tildes, la ñ, los signos de apertura (¿¡) y los números largos como un RUT se parten en varios tokens, mientras que en inglés una palabra suele entrar casi entera. El mismo contenido en español puede costar un 20-40% más de tokens.

Question 3

¿Qué es el mapa 3D de palabras?

Accepted Answer

Una IA convierte cada palabra en un vector (una lista de cientos de números) llamado embedding, donde las palabras de significado parecido quedan cerca. Eso es lo que hace posible la búsqueda semántica y los agentes que 'entienden' tus documentos. Acá proyectamos esos vectores a 3D para que puedas verlo: las palabras se agrupan solas por tema.

Question 4

¿Esto sube mi texto a algún lado?

Accepted Answer

No. La tokenización corre en tu navegador, y el mapa 3D usa un modelo de IA que también se descarga y ejecuta en tu equipo. Nada de lo que escribas sale de tu computador.

Cómo te lee una IA

Preguntas frecuentes

¿Qué es un token?

¿Por qué el español gasta más tokens que el inglés?

¿Qué es el mapa 3D de palabras?

¿Esto sube mi texto a algún lado?

¿Querías medir si las IAs te encuentran y te citan?