<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Palmera blog &#187; Audio e Informática</title>
	<atom:link href="http://www.pablogindel.com/category/audio/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.pablogindel.com</link>
	<description>robots, música, cosas raras con electricidad</description>
	<lastBuildDate>Mon, 24 May 2010 00:00:22 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.8.2</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Reconocimiento de voz en SAMSA</title>
		<link>http://www.pablogindel.com/2010/03/reconocimiento-de-voz-novedades-de-samsa-2/</link>
		<comments>http://www.pablogindel.com/2010/03/reconocimiento-de-voz-novedades-de-samsa-2/#comments</comments>
		<pubDate>Fri, 05 Mar 2010 02:38:08 +0000</pubDate>
		<dc:creator>pabloxid</dc:creator>
				<category><![CDATA[Artículos técnicos, etc.]]></category>
		<category><![CDATA[Audio e Informática]]></category>
		<category><![CDATA[ANN]]></category>
		<category><![CDATA[arduino]]></category>
		<category><![CDATA[artificial neural network]]></category>
		<category><![CDATA[atmega128]]></category>
		<category><![CDATA[atmel]]></category>
		<category><![CDATA[AVR]]></category>
		<category><![CDATA[backpropagation]]></category>
		<category><![CDATA[gradient descent]]></category>
		<category><![CDATA[hexapod]]></category>
		<category><![CDATA[hexápodo]]></category>
		<category><![CDATA[microcontroller]]></category>
		<category><![CDATA[montevideo]]></category>
		<category><![CDATA[neural network]]></category>
		<category><![CDATA[pablo gindel]]></category>
		<category><![CDATA[physical computing]]></category>
		<category><![CDATA[processing]]></category>
		<category><![CDATA[programming]]></category>
		<category><![CDATA[reconocimiento de voz]]></category>
		<category><![CDATA[red neuronal]]></category>
		<category><![CDATA[robot]]></category>
		<category><![CDATA[robótica]]></category>
		<category><![CDATA[robotics]]></category>
		<category><![CDATA[robots]]></category>
		<category><![CDATA[SAMSA]]></category>
		<category><![CDATA[sigmoid]]></category>
		<category><![CDATA[speech recognition]]></category>
		<category><![CDATA[steepest descent]]></category>
		<category><![CDATA[TCFM]]></category>
		<category><![CDATA[training]]></category>
		<category><![CDATA[uruguay]]></category>
		<category><![CDATA[wiring]]></category>

		<guid isPermaLink="false">http://www.pablogindel.com/?p=548</guid>
		<description><![CDATA[
 
En setiembre del año pasado, luego de su presentación en el marco de los workshops del 6º Campeonato de Sumo Robótico, todavía no tenía muy claro qué hacer con SAMSA, hacia dónde orientar su programación.
Finalmente decidí que SAMSA tenía que ser un robot capaz de un nivel más sofisticado de sensibilidad auditiva, ya que en [...]]]></description>
			<content:encoded><![CDATA[<h4><a href="http://www.pablogindel.com/2010/03/reconocimiento-de-voz-novedades-de-samsa-2/"><p><em>Click here to view the embedded video.</em></p></a></h4>
<p> </p>
<p style="TEXT-ALIGN: justify">En setiembre del año pasado, luego de su presentación en el marco de los workshops del <a href="http://www.pablogindel.com/2009/09/sexto-campeonato-uruguayo-de-sumo-robotico/" target="_blank">6º Campeonato de Sumo Robótico</a>, todavía no tenía muy claro qué hacer con SAMSA, hacia dónde orientar su programación.</p>
<p style="TEXT-ALIGN: justify">Finalmente decidí que SAMSA tenía que ser un robot capaz de un nivel más sofisticado de sensibilidad auditiva, ya que en mis robots anteriores había experimentado más que nada con diversos tipos de dispositivos ópticos (con mayor o menor suerte), y de emisores de sonido. Esto podría darme la excusa, por ejemplo, para desarrollar un sistema de reconocimiento del ritmo, que le permitiera al robot bailar al compás de la música (y de paso me serviría para el momentáneamente abandonado proyecto <a href="http://www.pablogindel.com/2009/08/el-zappator/" target="_blank">Zappator</a>). Por otro lado, me interesaba también experimentar con redes neuronales, ya que suponía que éstas podrían constituir una alternativa a tener que programar línea por línea todo el comportamiento de un robot.</p>
<p style="TEXT-ALIGN: justify">Tal como había publicado en la <a href="http://www.pablogindel.com/2009/09/documentacion-de-samsa-1ª-entrega/" target="_blank">1ª etrega de la documentación de SAMSA</a>, la distribución total de tareas del robot a cargo de un sólo y modesto ATmega128 (microcontrolador de 8bit/128KB/16MHz) dejaba, en lo que respecta al audio, tan sólo la posibilidad de medir la intensidad del sonido cada cierto lapso, y ni soñar siquiera con algún tipo de análisis de frecuencias.</p>
<p style="TEXT-ALIGN: justify">La única alternativa parecía ser la de incluir un segundo procesador hardware, exclusivamente dedicado al procesamiento de sonido; pero eso implicaba agregar más componentes, en definitiva, exigirle más al ya sobrecargado sistema electro-mecánico del robot. Era mucho trabajo, y no me convencía.</p>
<p style="TEXT-ALIGN: justify">Se me ocurrió entonces otra solución: al mejor estilo “<a href="http://es.wikipedia.org/wiki/Sinclair_ZX81" target="_blank">ZX-81</a>”, el robot entraría temporalmente en un modo “escucha”, durante el cual no podría moverse, mostrar gráficos ni hacer ninguna otra cosa; utilizaría todos sus recursos para “analizar” el audio y actuar en consecuencia. La idea sería aumentar la frecuencia de las interrupciones (a 8KHz, de hecho), y sustituir la actual ISR (interrupt service routine), por otra que sólo procesara audio.</p>
<p style="TEXT-ALIGN: justify">Bien, y cuando decimos “procesar audio”, lo primero que nos viene a la mente es analizar frecuencias. ¿Por qué? Por muchísimas razones, talvez la más importante es que nuestro cerebro mismo percibe el sonido de esa manera. Como no soy para nada experto en <a href="http://es.wikipedia.org/wiki/Transformada_r%C3%A1pida_de_Fourier" target="_blank">FFT</a>, ni estaba seguro de que fuera realmente posible su implementación con estos escasos recursos de cómputo, busqué algún tipo de proceso más liviano, hasta que llegué a un algoritmo que yo mismo bauticé “<strong>filtros por correlation recursivos</strong>”, que ya debe estar inventado, con otro o con el mismo nombre, y que veremos en breve.</p>
<p style="TEXT-ALIGN: justify">Una vez implementados los 4 filtros de frecuencias fijas (o bandas, no me pregunten.. por cierto, es probable que toda la implementación esté plagada de errores de <a href="http://es.wikipedia.org/wiki/Aliasing" target="_blank">aliasing</a> y distorsiones de todo tipo; no obstante, contra todo pronóstico, funciona) mirando en la pantalla las gráficas que estos filtros producían, tuve la intuición de que era posible intentar un reconocimiento de palabras, y eso me iba a dar la excusa para “entrarle” a las redes neuronales.</p>
<p style="TEXT-ALIGN: justify">Pasaron un poco más de 6 meses, durante los cuales primero desarrollé la herramienta de diseño y entrenamiento de redes neuronales (<a href="http://www.pablogindel.com/2009/12/palmer-neural-networks/" target="_blank">Palmer Neural Networks</a>), pero después, al momento de usarla, me daba cuenta de que faltaba algo y no podía avanzar, estaba bloqueado. Por un lado no disponía de mucho tiempo para pensar en esta idea, y por otro lado había empezado a dudar de que fuera posible cumplir con el objetivo. Finalmente a fines de febrero de este año, comencé a dedicarle horas al proyecto, hasta que llegué a este resultado, que dista de ser ideal, pero que nos ilustra claramente qué podemos esperar y qué no, de un sistema con estas características.</p>
<p style="TEXT-ALIGN: justify">Los invito a compartir un viaje por la arquitectura interna de un sistema de reconocimiento de palabras implementado íntegramente en un microcontrolador ATmega128.</p>
<p style="TEXT-ALIGN: justify"> </p>
<p style="TEXT-ALIGN: justify"><span style="color: #000000;"><strong>Siguiente sección &#8211;&gt; </strong><a href="http://www.pablogindel.com/informacion/Reconocimiento-de-voz/" target="_self"><strong>Reconocimiento de voz en un ATmega128</strong></a></span></p>
<p style="TEXT-ALIGN: justify"><span style="color: #000000;"> </span></p>
]]></content:encoded>
			<wfw:commentRss>http://www.pablogindel.com/2010/03/reconocimiento-de-voz-novedades-de-samsa-2/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Síntesis Modular con Processing</title>
		<link>http://www.pablogindel.com/2010/01/sintesis-modular-con-processing/</link>
		<comments>http://www.pablogindel.com/2010/01/sintesis-modular-con-processing/#comments</comments>
		<pubDate>Mon, 11 Jan 2010 00:08:28 +0000</pubDate>
		<dc:creator>pabloxid</dc:creator>
				<category><![CDATA[Audio e Informática]]></category>
		<category><![CDATA[Música]]></category>
		<category><![CDATA[AM]]></category>
		<category><![CDATA[chebyshev]]></category>
		<category><![CDATA[convolution]]></category>
		<category><![CDATA[DSP]]></category>
		<category><![CDATA[envelope]]></category>
		<category><![CDATA[envolvente]]></category>
		<category><![CDATA[FFT]]></category>
		<category><![CDATA[filter]]></category>
		<category><![CDATA[filtro]]></category>
		<category><![CDATA[FM]]></category>
		<category><![CDATA[fourier]]></category>
		<category><![CDATA[IIR]]></category>
		<category><![CDATA[javasound]]></category>
		<category><![CDATA[MIDI]]></category>
		<category><![CDATA[minim]]></category>
		<category><![CDATA[modular]]></category>
		<category><![CDATA[oscilador]]></category>
		<category><![CDATA[oscillator]]></category>
		<category><![CDATA[processing]]></category>
		<category><![CDATA[síntesis]]></category>
		<category><![CDATA[synth]]></category>
		<category><![CDATA[synthesis]]></category>

		<guid isPermaLink="false">http://www.pablogindel.com/?p=276</guid>
		<description><![CDATA[Introducción.
Buscando una herramienta para programar y experimentar con audio, efectos y síntesis, decidí probar la biblioteca Minim de Processing. Existen muchos entornos informáticos interesantes para diseñar sonido, algunos son gráficos, otros son de escribir código, algunos son libres, otros son pagos; cito algunos ejemplos: Reaktor, Max-MSP, PureData, SynthEdit, SynthMaker, JSyn, Csound, SuperCollider, ChucK.
Dentro de Processing, [...]]]></description>
			<content:encoded><![CDATA[<h4><span style="color: #000000;">Introducción.</span></h4>
<p style="TEXT-ALIGN: justify">Buscando una herramienta para programar y experimentar con audio, efectos y síntesis, decidí probar la biblioteca <a href="http://code.compartmental.net/tools/minim/" target="_blank">Minim</a> de Processing. Existen muchos entornos informáticos interesantes para diseñar sonido, algunos son gráficos, otros son de escribir código, algunos son libres, otros son pagos; cito algunos ejemplos: Reaktor, Max-MSP, PureData, SynthEdit, SynthMaker, JSyn, Csound, SuperCollider, ChucK.<span id="more-276"></span></p>
<p style="TEXT-ALIGN: justify">Dentro de <a href="http://processing.org/" target="_blank">Processing</a>, existen varias bibliotecas para manejar sonido, entre ellas: Ess, Sonia y Minim, siendo esta última la que viene con la distribución oficial del producto. Rápidamente, repasemos las principales ventajas e inconvenientes -a mi modesto entender- de Minim:</p>
<ul style="TEXT-ALIGN: justify">
<li>Ventajas: es simple, transparente, bastante bien documentada y Open Source.</li>
<li>Inconvenientes: utiliza <a href="http://java.sun.com/products/java-media/sound/" target="_self">Java Sound</a> para comunicarse con el hardware de audio.</li>
</ul>
<p style="TEXT-ALIGN: justify">Muchas de las bibliotecas de Processing son justamente &#8220;wrappers&#8221; de las funcionalidades de Java. Minim utiliza Java Sound para el audio I/O, partes de otras bibliotecas para otras tareas -como reproducir mp3, por ejemplo- pero también agrega cosas propias e interesantes, en materia de análisis, procesamiento y generación de sonido. A su vez, uno de los principales inconvenientes del sistema de audio de Java es que no soporta <a href="http://www.steinberg.net/en/company/steinberg_technology.html" target="_blank">ASIO</a>, que como todos sabemos, es la única manera de obtener baja<em> latencia</em>, al menos bajo Windows XP.</p>
<p style="TEXT-ALIGN: justify"><span style="color: #000000;"><strong>¿Cómo funciona la generación de sonido a nivel de software?</strong></span></p>
<p style="TEXT-ALIGN: justify">El audio digital, a nivel del software, se maneja en <em>buffers</em>. Un buffer es un conjunto de muestras -por ejemplo, 1024 muestras- que se envían o se reciben en bloque hacia o desde el hardware. Mientras la tarjeta de audio reproduce esas 1024 muestras (lo que le llevará 23ms, si el muestreo es de 44,1KHz), el programa tiene tiempo de calcular el bloque siguiente. Cuanto más grande sea el buffer, o sea cuantas más muestras contenga, mayor será la latencia de la que hablábamos en el párrafo anterior (más información sobre buffers y latencia <a href="http://www.pablogindel.com/2009/07/manual-de-audio-2008/">aqui</a>).</p>
<p style="TEXT-ALIGN: justify">En Minim, la clase <a href="http://code.compartmental.net/tools/minim/manual-oscillator/" target="_blank">Oscillator</a> es la base de los generadores de sonido. Cuando se llama al método &#8220;<em>generate&#8221;</em>, este &#8220;llena&#8221; un buffer con una forma de onda calculada de alguna manera, por ejemplo con la función trigonométrica seno.</p>
<p style="TEXT-ALIGN: justify">Una consecuencia interesante de esta naturaleza de Minim, es que si nosotros intentamos modificar un parámetro de la onda que se está generando -por ejemplo su amplitud o su frecuencia- desde el módulo principal (la Draw() de Processing) ya sea a partir de un control externo o de una función prefijada, los cambios se van a manifestar de a &#8220;saltos&#8221; equivalentes a la duración del buffer (23ms, en el ejemplo que veíamos). Esto nos impide hacer un cambio gradual y continuo de cierto parámetro, por ejemplo una <a href="http://es.wikipedia.org/wiki/Envolvente_ac%C3%BAstico" target="_blank">envolvente de amplitud</a>. Para lograr este tipo de control, necesitamos implementar otro &#8220;Oscillator&#8221; que genere la señal de control, y que el primer &#8220;Oscillator&#8221; consulte a esa señal al calcular cada muestra que pone en el buffer.</p>
<p style="TEXT-ALIGN: justify">Aplicando esta idea a diversos módulos de la biblioteca, e implementando algunos módulos nuevos, surgió la <strong>Minim 2.02 PE</strong> (palmer edition), con la cual podemos hacer una modesta síntesis modular, que paso a describir y ejemplificar en la página a continuación.</p>
<h4 style="TEXT-ALIGN: justify"><span style="color: #000000;"> </span></h4>
<p style="TEXT-ALIGN: justify"><span style="color: #000000;"><strong>Siguiente sección &#8211;&gt; </strong><a href="http://www.pablogindel.com/informacion/minim-2-02-palmer-edition/" target="_self"><strong>Minim 2.02 Palmer Edition</strong></a></span></p>
<p style="TEXT-ALIGN: justify"><span style="color: #000000;"> </span></p>
]]></content:encoded>
			<wfw:commentRss>http://www.pablogindel.com/2010/01/sintesis-modular-con-processing/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Palmer Neural Networks</title>
		<link>http://www.pablogindel.com/2009/12/palmer-neural-networks/</link>
		<comments>http://www.pablogindel.com/2009/12/palmer-neural-networks/#comments</comments>
		<pubDate>Fri, 04 Dec 2009 02:17:44 +0000</pubDate>
		<dc:creator>pabloxid</dc:creator>
				<category><![CDATA[Artículos técnicos, etc.]]></category>
		<category><![CDATA[Audio e Informática]]></category>
		<category><![CDATA[General]]></category>
		<category><![CDATA[3D]]></category>
		<category><![CDATA[algoritmo de entrenamiento]]></category>
		<category><![CDATA[ANN]]></category>
		<category><![CDATA[artificial neural network]]></category>
		<category><![CDATA[backpropagation]]></category>
		<category><![CDATA[bias]]></category>
		<category><![CDATA[feedforward]]></category>
		<category><![CDATA[gradiente descendente]]></category>
		<category><![CDATA[Java]]></category>
		<category><![CDATA[mínimo local]]></category>
		<category><![CDATA[montevideo]]></category>
		<category><![CDATA[neural network]]></category>
		<category><![CDATA[pablo gindel]]></category>
		<category><![CDATA[perceptron]]></category>
		<category><![CDATA[processing]]></category>
		<category><![CDATA[red neuronal]]></category>
		<category><![CDATA[redes neuronales]]></category>
		<category><![CDATA[sigmoide]]></category>
		<category><![CDATA[uruguay]]></category>

		<guid isPermaLink="false">http://www.pablogindel.com/?p=234</guid>
		<description><![CDATA[Como decíamos en artículos anteriores, existen -en principio- dos caminos para lograr que un programa se comporte de determinada manera en función de ciertas variables de entrada: elaborando una tabla con todas las posibles combinaciones de esas variables y sus respectivas acciones asociadas, o econtrando algún tipo de modelo matemático, una fórmula o un algoritmo [...]]]></description>
			<content:encoded><![CDATA[<p style="TEXT-ALIGN: justify">Como decíamos en artículos anteriores, existen -en principio- dos caminos para lograr que un programa se comporte de determinada manera en función de ciertas variables de entrada: elaborando una <strong>tabla</strong> con todas las posibles combinaciones de esas variables y sus respectivas acciones asociadas, o econtrando algún tipo de modelo matemático, una fórmula o un <strong>algoritmo</strong> que aplicado a dichas variables nos dé el resultado buscado en cada caso.</p>
<p style="TEXT-ALIGN: justify"><span id="more-234"></span>Cuando la cantidad de combinaciones de variables de entrada es demasiado grande como para elaborar una tabla, y la función es demasiado compleja como para encontrar un algoritmo, las <strong>Redes Neuronales Artificiales </strong>constituyen una manera distinta de abordar el problema, sumamente efectiva aunque no perfecta, como ya veremos.</p>
<p style="TEXT-ALIGN: justify">Podríamos considerar a la RNA como una especie de &#8220;algoritmo universal&#8221;, capaz de responder de muchísimas maneras distintas, y al que podemos &#8220;enseñar&#8221; el comportamiento deseado &#8220;mostrándole&#8221; ejemplos del mismo (una tabla parcial), para luego esperar que se comporte de la manera buscada frente a todos los casos posibles. Precisamente en esto radican sus principales virtud y defecto: el porcentaje de <em>aciertos</em> puede ser increíblemente grande (teniendo en cuenta lo general que es el método) pero no tenemos ninguna garantía de la <em>exactitud</em> del resultado. La analogía con un &#8220;cerebro&#8221; animal surge inmediatamente.</p>
<p style="TEXT-ALIGN: justify">Existen en internet numerosos artículos introductorios y avanzados, que explican claramente el funcionamiento de una RNA, mucho mejor que cualquier cosa que yo pudiera escribir aquí al respecto (empezando por <a href="http://es.wikipedia.org/wiki/Red_neuronal_artificial" target="_blank">este</a>). Mi aporte, en cambio, consistirá en presentar un programa mediante el cual podemos tener una aproximación práctica a la materia, experimentar con redes neuronales, introducir ejemplos reales, lidiar con el entrenamiento y visualizar el proceso de aprendizaje. <strong>PNN</strong> nos permite &#8220;sentir&#8221; las redes neuronales artificiales en nuestra propia experiencia, y también resolver algún caso práctico, que fue lo que originalmente me motivó a desarrollarlo.</p>
<p style="TEXT-ALIGN: justify"><strong>Características técnicas del programa.</strong></p>
<p style="TEXT-ALIGN: justify">Este programa  se basa en el artículo de Steven W. Smith sobre redes neuronales artificiales, en el capítulo 26 de su excelente <a href="http://www.dspguide.com/ch26.htm" target="_blank">The Scientist and Engineer&#8217;s Guide to DSP</a>. La red presentada vendría a ser un <em>perceptrón multicapa</em>, con una <em>capa de entrada</em>, una <em>capa oculta</em> y una <em>capa de salida</em>, cada una de ellas interconectada totalmente con la siguiente, con neuronas de <em>bias</em> en las dos primeras capas  y con función de transferencia <em>sigmoide</em> en cada neurona.  El algoritmo de entrenamiento es el que propone dicho autor, al que llama <em>steepest descent</em>, pero que también podemos encontrar bajo el nombre de <em>gradient descent</em> o simplemente <strong>backpropagation</strong>.</p>
<p style="TEXT-ALIGN: justify"><strong>Instrucciones</strong></p>
<p style="TEXT-ALIGN: justify">Para invocar el applet, hagan click <a title="Palmer Neural Networks" href="http://www.pablogindel.com/applets/PNN.html" target="_blank"><strong>aquí</strong></a>.</p>
<p style="TEXT-ALIGN: justify">Al hacerlo, aparecerán 2 ventanas: la ventana de <em>visualización</em>, hecha en <a href="http://processing.org/" target="_blank">Processing</a>, y el <em>panel de control</em> flotante, hecho en <a href="http://www.java.com/" target="_blank">Java</a> (que a veces queda oculto tras aquella).</p>
<p style="TEXT-ALIGN: justify">Lo primero que debemos hacer es <em>dimensionar</em> nuestra red. Escribimos el número de neuronas o <em>nodos</em> de cada capa, y apretamos el botón &#8220;Dimensionar&#8221;. Al hacerlo aparecerá en la ventana de visualización un modelo 3D en el que las neuronas de cada capa están representadas por esferas de distinto color (y las de <em>bias</em>, de un tamaño ligeramente mayor y blancas [ya nos ocuparemos de las opciones de esa visualización, antes de eso, sigamos con la parte "científica"]).</p>
<p style="TEXT-ALIGN: justify">Al apretar el botón &#8220;Aleatorizar pesos&#8221; aparecen las conexiones entre las neuronas; las verdes son positivas y las azules negativas, y su diámetro es proporcional al <em>peso</em> de la conexión correspondiente.</p>
<p style="TEXT-ALIGN: justify">A continuación deberíamos ir a &#8220;Archivo&#8221; y seleccionar &#8220;Cargar set de ejemplos&#8221;, pero lamentablemente esta opción no está habilitada en las <em>applets</em> de internet, por razones de seguridad. En su lugar podemos ir a &#8220;Ayuda&#8221; y seleccionar &#8220;Demo&#8221;. Esto tendrá el efecto de dimensionar una red con 7 entradas y 3 salidas, y cargar 3 sets de ejemplos.</p>
<p style="TEXT-ALIGN: justify">Para simplificar las cosas, todos los ejemplos están &#8220;asociados&#8221; a una salida; esto quiere decir que se asume que producen &#8220;<strong>1</strong>&#8221; en dicha salida y &#8220;<strong>0</strong>&#8221; en todas las demás. En la lista podemos ver a qué salida está asignado cada ejemplo. Los ejemplos se pueden sacar, seleccionándolos y apretando la tecla &#8220;suprimir&#8221;. Si apretamos &#8220;Enter&#8221; sobre un ejemplo, éste se carga arriba, y podemos testear el comportamiento de la red apretando &#8220;Procesar salida&#8221;. También es posible ingresar valores manualmente en ese campo y probarlos, y una vez ingresados se pueden agregar a la lista con el botón &#8220;Agregar ejemplo&#8221;. Los valores en las entradas pueden ser <em>enteros</em> de cualquier tamaño; los pesos son números de <em>coma flotante</em>, y los valores de salida son de coma flotante entre <strong>0</strong> y <strong>1</strong>.</p>
<p style="TEXT-ALIGN: justify">Si ahora probamos cualquier grupo de valores de entrada, el resultado en las tres salidas va a ser siempre aproximadamente 0,5. Eso se debe a que la red no está <em>entrenada</em> aun. Para entrenarla debemos apretar el botón &#8220;Iniciar aprendizaje&#8221;. Al hacerlo, los pesos se irán modificando, y un número grande a la derecha nos irá indicando la <em>suma del error</em> que producen todos los ejemplos al ser procesados en la red actual. El objetivo del &#8220;juego&#8221; (si usted decide aceptarlo) consiste en dejar ese valor lo más bajo posible. El proceso de optimización se repite 1000 veces cada vez que apretamos &#8220;Iniciar aprendizaje&#8221;, pero habitualmente esto no es suficiente; la cantidad de repeticiones se puede subir a 10000 con el deslizador de abajo a la izquierda. En todo momento podemos ir probando el comportamiento de la red, entre aprendizaje y aprendizaje.</p>
<p style="TEXT-ALIGN: justify">Hasta aquí la operación general del programa. Veamos ahora los detalles.</p>
<p style="TEXT-ALIGN: justify"><strong>Redimensionar la red</strong></p>
<p style="TEXT-ALIGN: justify">Al cambiar el número de neuronas en las capas de entrada o de salida, se pierden todos los ejemplos y el aprendizaje realizado. No así al redimensionar la <strong>capa oculta</strong>. De hecho, es un buen recurso, si notamos que nuestra red tiene &#8220;dificultades para aprender&#8221;, dotarla de más &#8220;capacidad&#8221; aumentando el número de neuronas de la capa oculta.</p>
<p style="TEXT-ALIGN: justify"><strong>Factor de aprendizaje</strong></p>
<p style="TEXT-ALIGN: justify">Al aumentar este número, hacemos que el aprendizaje sea más rápido, pero también inestable; en ocasiones el error puede quedar oscilando o incluso aumentar. Al disminuir el valor, el aprendizaje se vuelve lento pero seguro.</p>
<p style="TEXT-ALIGN: justify"><strong>Aprendizaje extra</strong></p>
<p style="TEXT-ALIGN: justify">La idea de este parámetro está sacada del antes citado libro de S. W. Smith, y consiste darle más importancia, en el aprendizaje, a los ejemplos &#8220;positivos&#8221; o a los &#8220;negativos&#8221; (un ejemplo destinado a la salida <strong>2</strong> es un ejemplo &#8220;negativo&#8221; para la salida <strong>1</strong>). Sinceramente yo no encontré ningún resultado con esto, lo voy a revisar para la próxima versión.</p>
<p style="TEXT-ALIGN: justify"><strong>Menú Archivo</strong></p>
<p style="TEXT-ALIGN: justify">Todas las opciones del menú Archivo están desactivadas, algunas por razones de seguridad del Java, otras porque no están implementadas aun. La más importante sería la de salvar los pesos una vez concluido el entrenamiento. También podríamos volverlos a cargar para usarlos como punto de partida de una siguiente sesión de aprendizaje.</p>
<p style="TEXT-ALIGN: justify"><strong>Menú Configuración</strong></p>
<p style="TEXT-ALIGN: justify">El &#8220;Modo Automático&#8221; va a estar implementado en la próxima versión. Consistiría en que el propio programa tome nota de cómo va decreciendo o aumentando el <strong>error</strong>, ajuste automáticamente los parámetros de entrenamiento, y siga actuando solo hasta llegar a un mínimo de error prefijado.</p>
<p style="TEXT-ALIGN: justify">Los distintos &#8220;modos de aleatorización&#8221; afectan al comportamiento del botón &#8220;Aleatorizar pesos&#8221;. El algoritmo de aprendizaje parte de un estado aleatorio de los pesos y va modificando sus valores en el sentido en que el error decrece. Puede pasar que en determinado momento el error no descienda más, pero aun continúe alto: estaríamos frente a lo que llaman un <em>mínimo local</em>. Aquí viene al caso la aleatorización <em>relativa</em>, que lo que hace es modificar levemente los pesos pero en relación a su valor actual (introduce una pequeña &#8220;mutación&#8221;). Con esto conseguimos, a veces, que el error aumente un poco pero luego siga disminuyendo, es algo así como  &#8221;un paso atrás, dos adelante&#8221;.</p>
<p style="TEXT-ALIGN: justify"><strong>Respecto al error</strong></p>
<p style="TEXT-ALIGN: justify">El dato mostrado a la derecha como &#8220;error&#8221; se calcula de la siguiente manera:</p>
<p style="TEXT-ALIGN: justify">cada uno de los ejemplos que están en la lista se pasa por la red, y se mide la diferencia entre el valor que debe producir en cada salida y el que realmente produce. Todos estos valores elevados al cuadrado, sumados entre sí y sumados con los provenientes del resto de los ejemplos, nos dan el <strong>error</strong> total para un estado en particular de la red (media cuadrática). Esto quiere decir que cuanto mayores sean el número de salidas y el número de ejemplos cargados, mucho más difícil va a ser llevar ese valor a <strong>0 </strong>(y por supuesto, esto también depende del <em>contenido </em>de los ejemplos mismos). En el caso del problema que viene como <em>demo</em> (que, dicho sea de paso, consiste en diversas versiones de las palabras &#8220;uno&#8221;, &#8220;dos&#8221; y &#8220;tres&#8221; capturadas y codificadas por un nuevo programa de procesamiento de audio que estoy desarrollando para <a href="http://www.pablogindel.com/2009/07/samsa-el-hexapodo/" target="_blank">SAMSA</a>) la red se desempeña aceptablemente bien con el error en <strong>20</strong>, más o menos.</p>
<p style="TEXT-ALIGN: justify"><strong>Opciones de visualización</strong></p>
<p style="TEXT-ALIGN: justify">Por último, la parte &#8220;coqueta&#8221; del programa.</p>
<p style="TEXT-ALIGN: justify">Al hacer foco en la ventana de visualización, quedan disponibles las siguientes opciones:</p>
<ul style="TEXT-ALIGN: justify">
<li>haciendo click con el botón derecho del mouse, detenemos o reanudamos la rotación automática del modelo. Cuando la rotación automática está detenida, podemos rotarlo libremente con el botón izquierdo del mouse.</li>
<li>con las teclas de dirección seleccionamos un parámetro, que va a aparecer detallado en el ángulo inferior izquierdo de la pantalla, y con las teclas &#8220;<strong>+</strong>&#8221; y &#8220;<strong>&#8211;</strong>&#8221; modificamos ese parámetro.</li>
<li>los parámetros que se pueden modificar son: la disposición espacial de las neuronas en cada capa, el espaciado de las mismas, la rotación de todo el plano de la capa y la cantidad de caras de la sección de los &#8220;caños&#8221; que interconectan a las neuronas, que por defecto es 20, pero puede ir de 2 a 50, generando la sensación cilíndrica.</li>
</ul>
<p style="TEXT-ALIGN: justify"><strong>Mejoras para el futuro</strong></p>
<p style="TEXT-ALIGN: justify">Esta es una lista de las mejoras que podrían implementarse en futuras versiones del <strong>PNN</strong>, algunas de las cuales fueron sugeridas por mis amigos Alvaro y Tomás  (y otras pueden ser un divague, también).</p>
<ul style="TEXT-ALIGN: justify">
<li>que las neuronas se muevan, respondiendo a leyes físicas, y que las fuerzas de atracción y repulsión dependan de los pesos.</li>
<li>ponerle sonido (con la biblioteca <em>minim</em> de Processing)</li>
<li>esferas texturadas que giren sobre sí mismas</li>
<li>que las conexiones cambien de color cuando son modificadas</li>
<li>que las neuronas vibren según su &#8220;energía&#8221;</li>
<li>que unas bolas circulen por adentro de los caños</li>
<li>rotación de las conexiones</li>
<li>hay que inventar algo para que no haya que apretar 200 veces &#8220;Iniciar aprendizaje&#8221;</li>
<li>salvar y cargar pesos</li>
<li style="TEXT-ALIGN: justify">modo automático: que combine algoritmos genéticos con el backpropagation.</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.pablogindel.com/2009/12/palmer-neural-networks/feed/</wfw:commentRss>
		<slash:comments>7</slash:comments>
		</item>
		<item>
		<title>La pelota de los dioses</title>
		<link>http://www.pablogindel.com/2009/08/la-pelota-de-los-dioses/</link>
		<comments>http://www.pablogindel.com/2009/08/la-pelota-de-los-dioses/#comments</comments>
		<pubDate>Sun, 02 Aug 2009 01:27:31 +0000</pubDate>
		<dc:creator>pabloxid</dc:creator>
				<category><![CDATA[Audio e Informática]]></category>
		<category><![CDATA[Música]]></category>
		<category><![CDATA[Physical Computing]]></category>
		<category><![CDATA[arduino]]></category>
		<category><![CDATA[bluetooth]]></category>
		<category><![CDATA[processing]]></category>

		<guid isPermaLink="false">http://www.pablogindel.com/?p=106</guid>
		<description><![CDATA[LPDLD fue el proyecto colectivo que encaramos en el &#8220;Taller de arte y computación física&#8221; de Alvaro Cassinelli, en diciembre de 2008. En escencia se trata de una esfera con un acelerómetro de 3 ejes, un módulo bluetooth para comunicar con la PC, y un programa en Processing que recibe los datos y genera a partir de ellos [...]]]></description>
			<content:encoded><![CDATA[<p>LPDLD fue el proyecto colectivo que encaramos en el &#8220;Taller de arte y computación física&#8221; de Alvaro Cassinelli, en diciembre de 2008. En escencia se trata de una esfera con un acelerómetro de 3 ejes, un módulo bluetooth para comunicar con la PC, y un programa en Processing que recibe los datos y genera a partir de ellos sonido, en este caso mensajes MIDI que son trasmitidos a un sintetizador (Reaktor). Ese vendría a ser su estado actual, pero el proyecto tuvo algunos cambios en el transcurso de su desarrollo, y todavía se está trabajando en él.<span id="more-106"></span></p>
<p>Este post es provisorio, como siempre, aquí van a ver parte de la presentación en dorkbot.mvd el 19 de abril de este año, pero prometo ampliar la información técnica y anecdótica de este maravilloso artefacto, en el futuro.</p>
<a href="http://www.pablogindel.com/2009/08/la-pelota-de-los-dioses/"><p><em>Click here to view the embedded video.</em></p></a>
]]></content:encoded>
			<wfw:commentRss>http://www.pablogindel.com/2009/08/la-pelota-de-los-dioses/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Manual de Audio 2008</title>
		<link>http://www.pablogindel.com/2009/07/manual-de-audio-2008/</link>
		<comments>http://www.pablogindel.com/2009/07/manual-de-audio-2008/#comments</comments>
		<pubDate>Sun, 19 Jul 2009 12:59:41 +0000</pubDate>
		<dc:creator>pabloxid</dc:creator>
				<category><![CDATA[Audio e Informática]]></category>
		<category><![CDATA[DAW]]></category>

		<guid isPermaLink="false">http://localhost/palmera/?p=3</guid>
		<description><![CDATA[Pequeño manual de audio para el técnico informático.
Este manual lo escribí en el 2008 para mis cursos. Actualmente lo estoy reformulando por completo, tratando de hacerlo menos denso. Esta entrada es provisoria, el slide contiene incluso algunas páginas en borrador. 

]]></description>
			<content:encoded><![CDATA[<p>Pequeño manual de audio para el técnico informático.</p>
<p>Este manual lo escribí en el 2008 para mis cursos. Actualmente lo estoy reformulando por completo, tratando de hacerlo menos denso. Esta entrada es provisoria, el slide contiene incluso algunas páginas en borrador. <span id="more-3"></span></p>
<div id="__ss_1739792" style="text-align: left; width: 425px;"><object style="margin: 0px;" classid="clsid:d27cdb6e-ae6d-11cf-96b8-444553540000" width="425" height="355" codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,40,0"><param name="allowFullScreen" value="true" /><param name="allowScriptAccess" value="always" /><param name="src" value="http://static.slidesharecdn.com/swf/ssplayer2.swf?doc=manualdeaudio2008-090719073304-phpapp01&amp;stripped_title=manual-de-audio-2008" /><param name="allowfullscreen" value="true" /><embed style="margin: 0px;" type="application/x-shockwave-flash" width="425" height="355" src="http://static.slidesharecdn.com/swf/ssplayer2.swf?doc=manualdeaudio2008-090719073304-phpapp01&amp;stripped_title=manual-de-audio-2008" allowscriptaccess="always" allowfullscreen="true"></embed></object></div>
]]></content:encoded>
			<wfw:commentRss>http://www.pablogindel.com/2009/07/manual-de-audio-2008/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
	</channel>
</rss>
