Existen en el mercado circuitos integrados que incorporan una serie de alófonos (conjunto de fonemas) almacenados en una memoria ROM interna. Aunque usualmente pertenecen a la fonética inglesa, mediante su combinación puede conseguirse cualquier palabra. Un ejemplo sería el integrado SP0256-AL2 de General Instruments, que contiene 64 alófonos ingleses, como por ejemplo OY(bOY), AY (skY) IY (sEE), pausa, etc.
Por otra parte, la creación de un convertidor texto-voz con registros propios supone grabar un conjunto de unidades para utilizarlas posteriormente. Todos sistemas de conversión utilizan algún tipo de unidad básica de síntesis y, en algunos casos, de reglas de síntesis. La obtención de toda esta información requiere mucho tiempo. Especialmente si la obtención se hace de forma manual o semimanual, ya que en dicho caso es necesaria la presencia de una persona para realizar los registros y, sobre todo, separar cada una de las unidades (segmentar). Además, este proceso se deberá repetir para cada una de las personas de las que se quieran extraer unidades.