VIC Talker

Poiché le vendite del computer continuavano a diminuire, il VIC-20 fu interrotto silenziosamente nel gennaio 1985. Forse l’ultima nuova periferica VIC-20 disponibile in commercio era il VIC-Talker, un sintetizzatore vocale; Ahoy! nel gennaio 1986 scrisse discutendone: “Che tu ci creda o no, un nuovo accessorio VIC … Eravamo sorpresi quanto te……..


Talktronics, Inc. – Prodotti vocali
PROSPETTIVA STORICA – 1984
A partire dal 1984, Talktronics ha prodotto sintetizzatori Text-To-Speech (TTS) per i personal computer Commodore VIC-20, C64 e C128. Questi sintetizzatori avevano la forma di moduli plug-in installati nella “porta di espansione” del computer. All’epoca, le caratteristiche di questi prodotti TTS erano piuttosto sofisticate per il prezzo esiguo ($ 89 USD!).

I computer Commodore erano basati sulla famiglia di microprocessori CMOS a 8 bit Rockwell R6502 e utilizzavano una versione della CPU denominata “6510” e prodotta dalla tecnologia MOS. I sintetizzatori TTS utilizzavano un chip “generatore di fonemi” della Silicon Systems, designato SSI263.

Di seguito è riportata una ristampa della scheda tecnica originale del “VIC-Talker”.

  • Advanced English text-to-speech rules
  • Numeric, decimal and simple fraction rules
  • Rules for dollars and cents
  • Two user-definable voices
  • Automatic or direct intonation control
  • Text, proofreading, spell & say and spell-only modes
  • User-programmable exceptions memory

VIC-TALKER fornisce la traduzione illimitata del vocabolario del testo in parlato sintetizzato utilizzando regole avanzate di pronuncia della lingua inglese e una memoria delle eccezioni espandibile dall’utente.

La cartuccia incorpora un mixer audio interno per fondere l’uscita vocale sintetizzata con i suoni generati dal chip sonoro “VIC” per effetti sonori simultanei con la voce. Le regole di sintesi vocale in inglese sono state sviluppate per massimizzare le prestazioni del chip sintetizzatore fonema, producendo una voce sintetizzata intelligibile da testo non modificato.

Oltre alle oltre 360 regole inglesi, l’interpretazione di stringhe numeriche che coinvolgono frazioni decimali, frazioni semplici, dollari e centesimi viene eseguita per consentire la corretta sintesi vocale di praticamente qualsiasi output di elaboratore di testi. I comandi BASIC come GOTO, GOSUB e PRINT # vengono tradotti per consentire una facile interpretazione degli elenchi di programmi BASIC.

Some sample translations:

INPUT TEXT VIC TALKER SAYS
126933one hundred twenty six thousand nine hundred thirty three
12.785twelve point seven eight five
$37.95thirty seven dollars and ninety five cents
$.08eight cents
(949) 555-1212area code nine four nine (pause) five five five one two one two
1/2one half
13/64thirteen sixty fourths
34A785XXXthree four A seven eight five X X X
GOTO 45go to forty five
PRINT #3, “My name is VIC”print on three my name is vic

Sono previste modalità speciali per definire e selezionare due diverse “voci”, da utilizzare parola per parola. In una modalità di “correzione di bozze”, la seconda voce viene utilizzata per richiamare punteggiatura e simboli.

La voce principale viene quindi utilizzata per sintetizzare le parole e i numeri nel testo. Il VIC-TALKER può anche essere programmato per funzionare in modalità “spell and say” o “spell-only”. Cambiare le due voci preprogrammate è estremamente facile per l’utente e, una volta impostate, ciascuna delle due voci può essere selezionata tramite comandi di controllo.

VIC-TALKER utilizza un’intonazione ponderata per la frase per fornire una voce ad altezza variabile per enfatizzare affermazioni, domande ed esclamazioni. Nella modalità monotonica, l’intonazione è controllata direttamente dai comandi parola per parola o lettera per lettera. Usando il controllo diretto del tono, l’utente può sintetizzare una voce che canta, con la gamma di sette ottave su una scala uniforme. La programmazione delle parole di eccezione definite dall’utente è facilmente realizzabile nella modalità di “apprendimento”.

L’utente ordina a VIC-TALKER di produrre la pronuncia desiderata di una parola speciale inviando la parola seguita da un’ortografia fonetica della parola. La stringa di lettere viene pronunciata secondo le regole inglesi, producendo una stringa di fonemi di output per il chip del sintetizzatore.

Questa stringa di output viene quindi memorizzata, su comando dell’utente, nel dizionario delle eccezioni, insieme alla parola originale. In questo modo, i nomi personali, i nomi delle città e delle vie o qualsiasi altra traduzione speciale di parole produrranno successivamente la pronuncia desiderata. Il dizionario delle eccezioni risiede nella EEPROM (memoria di sola lettura programmabile cancellabile elettricamente), in modo tale che il dizionario delle eccezioni non venga mai perso durante lo spegnimento e diventi un’estensione permanente delle regole interne. Vengono fornite funzionalità per modificare le eccezioni e impedire l’archiviazione ridondante.

Fonte: http://www.talktronics.com/speech.htm


Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *