El efecto túnel, la desintegración alfa y los orígenes de la mecánica cuántica.
Sumario:
Me atrevería a decir que todos los estudiantes de física que se encuentran por primera vez con la mecánica cuántica y, ¡cómo no!, también cualquier mortal ajeno al tema al que se le explique la cuestión con un cierto detalle, quedan fascinados por el efecto túnel, ese resultado genuinamente cuántico, que no tiene parangón en […]
Me atrevería a decir que todos los estudiantes de física que se encuentran por primera vez con la mecánica cuántica y, ¡cómo no!, también cualquier mortal ajeno al tema al que se le explique la cuestión con un cierto detalle, quedan fascinados por el efecto túnel, ese resultado genuinamente cuántico, que no tiene parangón en mecánica clásica, y que indica que una partícula siempre tiene una cierta probabilidad de atravesar una barrera de potencial aunque su energía sea inferior a la altura de la barrera y siempre que ésta tenga un tamaño espacial finito. Es como si cualquiera de nosotros pudiéramos “atravesar” una pared con una cierta probabilidad si nos abalanzamos contra ella sin que se produzca daño alguno, ni en la pared ni en nosotros mismos: esto aclara, creo, el carácter cuántico exclusivo del fenómeno. Pero veámoslo con un poco más de detalle.
Cualquier cuerpo en movimiento tiene una propiedad asociada al mismo que se denomina energía cinética y que en mecánica clásica se define como $latex T=mv^{2}/2$, donde m es la masa del cuerpo y v la velocidad con la que se mueve. Como vemos es siempre una cantidad positiva o igual a cero (cuando el cuerpo está en reposo).
Los cuerpos pueden tener asociado otro tipo de energía no ya debido a su estado de movimiento, sino a su posición. Este tipo de energía se denomina energía potencial, U, y puede definirse siempre que sobre el cuerpo actúen sólo fuerzas conservativas. Por ejemplo, si sostenemos en alto una bola, ésta tiene energía potencial gravitatoria, debido a que es atraída por la Tierra y si la soltamos caerá al suelo. Si tenemos un muelle fijado por un extremo a una pared y lo comprimimos, situando una pelota en el otro extremo, decimos que la pelota tiene energía potencial elástica. Si acercamos dos cuerpos cargados o dos imanes, uno frente a otro, ambos tienen energía potencial eléctrica o magnética, respectivamente. Las fuerzas puestas en juego en estos ejemplos (gravitatoria, elástica, eléctrica y magnética) son todas ellas conservativas. Sin embargo, otras fuerzas usuales como, por ejemplo, las fuerzas de rozamiento, la fuerza motriz de los motores o la fuerza muscular, son fuerzas no conservativas.
Pues bien, supongamos un cuerpo que se está moviendo en una sola dirección (que suponemos que es la dirección x) en una región del espacio de manera que su energía potencial tiene la forma que se muestra en la figura. Como vemos, según la posición en la que se encuentre el cuerpo, su energía potencial $latex U(x)$ toma distintos valores, presentando máximos y mínimos.
En física, la suma de la energía cinética y la energía potencial se denomina energía mecánica total o, simplemente, energía total. Existe un resultado fundamental que se conoce como teorema de conservación de la energía mecánica total que dice que si sobre un cuerpo sólo actúan fuerzas conservativas, la energía mecánica total del mismo se conserva. Es decir que en esas circunstancias, el cuerpo se moverá de manera que esa energía total no cambia independientemente de cuales sean su posición y su velocidad.
Supongamos, por ejemplo, que el cuerpo tiene una energía total igual a $latex E_{1}$ que, como vemos en la figura, es mayor que su energía potencial en cualquier punto x en que se pueda encontrar en su movimiento. La energía cinética de ese cuerpo variará según su posición y estará dada por $latex T_{1}(x)=E_{1}-U(x)$. La velocidad del cuerpo será por tanto $latex v=\sqrt{2[E_{1}-U(x)]/m}$ y como $latex E_{1}$ es mayor que $latex U(x)$, podemos calcular la raíz cuadrada y la velocidad tendrá un valor real y positivo (como debe ser). Con esa energía total, el cuerpo puede moverse “libremente” (por supuesto, de acuerdo a las leyes de la mecánica) a cualquier posición x.
Si la energía total del cuerpo fuese $latex E_{2}$, tendríamos una situación diferente. En efecto la partícula podría moverse (igual que en el caso anterior) a cualquier punto de la regiones que se encuentran a la izquierda de $latex P_{1}^{(2)}$ y a la derecha de $latex P_{2}^{(2)}$. Como vemos en esas posiciones la energía total $latex E_{2}$ es mayor que la energía potencial $latex U(x)$ y es posible obtener la velocidad como antes. Sin embargo, en los puntos situados entre $latex P_{1}^{(2)}$ y $latex P_{2}^{(2)}$ ocurre lo contrario: $latex U(x)$ es mayor que $latex E_{2}$, tendríamos que calcular la raíz cuadrada de una cantidad negativa y, por tanto, la velocidad no sería una cantidad real sino imaginaria y no podría representar una velocidad “válida” en mecánica clásica. Los puntos $latex P_{1}^{(2)}$ y $latex P_{2}^{(2)}$ se denominan puntos de retroceso clásico y cuando el cuerpo llega a ellos se encuentra una barrera de potencial que le impide proseguir su movimiento en ese sentido. El cuerpo encuentra una pared que le impide proseguir su camino. Una situación similar se presenta cuando el cuerpo tiene energías totales $latex E_{3}$ (en cuyo caso aparecen tres puntos de retroceso clásico) y $latex E_{4}$ (con un único punto de retroceso).
En mecánica cuántica esto no es así. La dinámica de un cuerpo está regida por su función de onda, que es una función cuyo módulo al cuadrado nos informa sobre la probabilidad de que el cuerpo se encuentre en una determinada posición. En las regiones clásicamente permitidas, la función de onda describe (como en el caso de la mecánica clásica) el cuerpo en movimiento; sin embargo, cuánticamente siempre hay una probabilidad no nula de que el cuerpo se encuentre en un punto de una región clásicamente prohibida. La función de onda en esas regiones responde a una función exponencial decreciente y salvo que la región clásicamente prohibida sea infinita (como sucede en el ejemplo de la figura a la derecha de los puntos $latex P_{3}^{(3)}$ y $latex P_{1}^{(4)}$ de retroceso) la función de onda permite “conectar” las regiones permitidas a ambos lados de la zona prohibida: a todos los efectos es como si el cuerpo hubiera encontrado en su camino un túnel que le hubiera permitido atravesar (con una cierta probabilidad que es posible calcular y medir) la barrera de potencial.
En la práctica el efecto túnel se pone de manifiesto en el caso de barreras de potencial de unos pocos nanómetros de anchura y en él están basados muchos dispositivos tecnológicos ampliamente usados hoy día. Entre otros podemos mencionar el microscopio de efecto túnel, los transistores, los diodos led, etc. Muchos fenómenos relacionados con la superconductividad y con la física de semiconductores como el efecto Josephson o la emisión fría de electrones, con la radiactividad y con algunos tipos de mutación espontánea observados en la molécula de ADN que tienen su origen en el efecto túnel cuántico.
El “descubrimiento» del efecto túnel se remonta a los últimos años de la década de 1920 y en ello jugó un papel muy relevante la desintegración alfa.
A finales del s. XIX, y en el famoso laboratorio Cavendish de Cambridge, entonces dirigido por J.J. Thomson, el físico E. Rutherford, neozelandés de nacimiento, descubrió las partículas alfa cuando estudiaba la radiación emitida por muchos materiales compuestos principalmente por elementos pesados como el uranio, el torio o el radio, que años antes había observado H. Becquerel. En 1909, el propio Rutherford y T. Royds, estudiante suyo en la universidad de Manchester, demostraron que las partículas alfa eran en realidad núcleos de helio, con una masa aproximadamente igual a 4 veces la del protón y una carga positiva de magnitud 2 veces la del electrón.
En 1911, el alemán H. Geiger y el inglés J.J. Nuttall establecieron la ley empírica que lleva su nombre (ley de Geiger-Nuttall) y que establece que cuanto mayor es el período de semidesintegración del radionúcleo que emite la partícula alfa, menor es la energía de ésta y viceversa. Ese mismo año, Rutherford planteó la hipótesis de la existencia del núcleo atómico para dar cuenta de los resultados de su famoso experimento del bombardeo de láminas de oro con radiación alfa, experimento que, en realidad, habían llevado a cabo dos años antes el propio Geiger y el inglés E. Marsden, entonces estudiante de grado.
Como a menudo sucede con algunos observables en física nuclear, los “números” relacionados con la desintegración alfa y esta ley de Geiger-Nuttall son epatantes. Por ejemplo, el núcleo de Th-232, que emite partículas alfa con una energía de 4.01 MeV, tiene un período de semidesintegración de 14000 millones de años, mientras que para otro isótopo del torio, el Th-218, ese período es de tan sólo 0.1 millonésimas de segundo y las partículas alfa emitidas tienen 9.67 MeV de energía: aumentar la energía en un factor 2, aproximadamente, hace que el período de semidesintegración aumente en un factor 1024. La razón de este comportamiento es que la dependencia entre el período de semidesintegración de un núcleo radiactivo y la energía de las partículas alfa que éste emite es de tipo exponencial. Así, si representamos el logaritmo decimal del período de semidesintegración en función de la energía las partículas alfa emitidas, los datos experimentales se sitúan sobre líneas suaves decrecientes. En la figura podemos ver la sistemática que siguen algunos isótopos de Po, Rn, Ra, Th y U, todos ellos con un número par de protones y neutrones.
En 1927 Rutherford publicó un artículo titulado “Estructura del átomo radiactivo y origen de los rayos alfa” [Philosophical Magazine 4 (1927) 580-605] en el que analizaba los resultados de un experimento en el que habían bombardeado una muestra de uranio natural, que está formado en más del 99% por átomos cuyo núcleo es U-238, con partículas alfa emitidas por un radionúcleo que entonces se denominaba RaC’ y que hoy día sabemos que es un isótopo de polonio, concretamente el Po-214. Debido a su carga positiva, las partículas alfa son repelidas por los núcleos blanco cuando se aproximan a ellos. Rutherford había demostrado con anterioridad que cuando los núcleos atómicos eran bombardeados con partículas cargadas, el proceso de dispersión podía describirse mediante la interacción de Coulomb. En el caso del experimento del que hablamos, Rutherford comprobó que su formulación seguía siendo válida para las partículas alfa emitidas por el Po-214, que tienen una energía de 7.88 MeV y que se aproximan hasta una distancia de unos 35 fm del centro del núcleo para ser posteriormente dispersadas sin producir ningún efecto en el mismo. [1 MeV es un millón de eV; 1 eV es la energía que adquiere un electrón cuando es acelerado por una diferencia de potencial de 1 V. Por otro lado, 1 fm (femtometro) es 10-15 m, es decir, la milbillonésima parte de un metro. ]
Sin embargo, a Rutherford le confundía este resultado ya que el U-238 es también un radionúcleo que emite partículas alfa de 4.27 MeV de energía. Un sencillo cálculo le permitió demostrar que para que esas partículas emitidas alcanzaran esa energía bastaba con que partieran de una posición distante unos 60 fm del centro del núcleo. ¿Cómo era posible que las partículas alfa de 7.88 MeV del Po-214 no pudieran vencer la repulsión electrostática de los núcleos de U-238, después de acercarse tanto a ellos y, a la misma vez, el U-238 emitiera partículas alfa de mucha menos energía y desde casi el doble de distancia?
Rutherford propuso en el artículo antes mencionado una solución del problema que estaba basada en un modelo que él había utilizado con éxito para explicar muchas reacciones nucleares que había estudiado junto a sus colaboradores. Se trataba del modelo “de satélites” del núcleo. En el caso que nos ocupa, Rutherford postuló que el U-238 estaba constituido por un núcleo cargado positivamente y varias partículas alfa que orbitaban alrededor de él, a una distancia de 60-70 fm. Cada una de las partículas alfa “satelite” incluía dos electrones y no tenía, por tanto, carga. Cuando el núcleo se desintegraba, una de esas partículas alfa “satélite” se deshacía de sus dos electrones que eran atraídos y absorbidos por el núcleo positivo, mientras que la partícula alfa, que quedaba cargada positivamente, era repelida por el propio núcleo. Por otro lado, las partículas alfa del Po-214 con las que el blanco de uranio era bombardeado, podían atravesar la nube de partículas alfa “satélite” sin sufrir ningún efecto, ya que eran neutras, y aproximarse al núcleo hasta una distancia próxima al mismo, para ser entonces repelidas.
En ese estado de cosas hizo su aparición G. Gamow, físico ruso que en el verano de 1928 se encontraba de visita en el Instituto de Física Teórica de Gotinga (Alemania), que entonces estaba bajo la dirección de M. Born, y en el que se habían desarrollado muchos de los avances de la incipiente teoría cuántica. Apenas dos meses después de su llegada a Gotinga, Gamow publicó la interpretación correcta del experimento de Rutherford en un artículo titulado “Sobre la teoría cuántica de los núcleos atómicos” [Zeitschrift für Physik 51 (1928) 204-212], que estaba firmado el 29 de julio de 1928 y que se recibió en la redacción de la revista el 2 de agosto.
En su artículo Gamow, convencido de la falta de conocimiento de los posibles lectores de su trabajo acerca de la mecánica cuántica, abordó en primer lugar el problema de una partícula que atraviesa una barrera rectangular de potencial. Y lo hace tal y como hoy día se explica ese problema a los estudiantes de mecánica cuántica básica. En segundo lugar Gamow resuelve el problema de una partícula que atraviesa dos barreras de potencial simétricas. Y, finalmente, aborda el problema nuclear que trataba de resolver y, aunque la forma del potencial nuclear en las proximidades del núcleo no era conocida en detalle, los problemas simples resueltos con anterioridad le permiten establecer las pautas necesarias para el caso de la interacción de las partículas alfa con los núcleos. Al final del artículo Gamow dice:
«Es conocido que se dibujamos el logaritmo de la constante de desintegración frente a la energía de la partícula emitida, todo los puntos de una familia radiactiva definida caen en una línea recta. Para diferentes familias obtenemos diferentes líneas paralelas. La fórmula empírica reza:
$latex lg\lambda=\text{Const}+bE$,
donde b es una constante que es común a todas las familias radiactivas.
El valor experimental de b (calculado de Ra-A y Ra) es$latex b_{exp}=1.02\times 10^{+7}$.
Si usamos el valor de la energía de Ra-A en nuestra fórmula obtenemos
$latex b_{teo}=0.7\times 10^{+7}$.
El acuerdo en el orden de magnitud muestra que las suposiciones básicas de nuestra teoría deben ser correctas.»
Los núcleos a los que Gamow aplicó el modelo son conocidos hoy día como Po-208 (el Ra-A) y Ra-226 (el Ra) y, efectivamente, tenía razón en su conclusión y su teoría era correcta.
Gamow no había hecho otra cosa que describir el efecto túnel, un nombre que no aparece explícitamente en el artículo. Otros dos físicos, el inglés Gurney y el norteamericano Condon, que entonces trabajaban en la universidad de Princeton, publicaron una breve carta titulada “Mecánica de ondas y desintegración radiactiva” [Nature 122 (1928) 439] en la que desarrollaban un modelo prácticamente idéntico al de Gamow. Este artículo tenía fecha del 30 de julio de 1928, un día más tarde que el de Gamow, y estos autores tampoco mencionan el efecto túnel.
El nombre del efecto se empezó a utilizar algunos años más tarde. En muchos textos se adjudica a Gamow, Gurney y Condon el “descubrimiento” del fenómeno, pero un año antes, el alemán F. Hund, conocido por haber realizado muchas aportaciones sobre la estructura atómica y molecular, publicó un trabajo en tres partes titulado “Sobre la interpretación del espectro molecular” [Zeitschrift für Physik 40 (1927) 742-764; 42 (1927) 93-120; 43 (1927) 805-826] en el que planteó un pozo de potencial doble en una dimensión para modelar los enlaces químicos y en los que indica dependencia exponencial de la probabilidad de que las partículas atraviesen barreras de potencial. El mismo año, otro físico alemán, L. Nordheim publicó un artículo titulado “Sobre la teoría de la emisión térmica y de la reflexión de electrones en metales” [Zeitschrift für Physik 46 (1927) 833] en el que aplicó el efecto túnel para describir la emisión electrónica por metales.
Todavía antes de que Gamow, Gurney y Condon intervinieran, el norteamericano R. Openheimer, muy conocido por haber intervenido notablemente durante el desarrollo de la bomba nuclear estadounidense, publicó un trabajo titulado “Sobre la teoría cuántica de las corrientes de campo autoeléctricas” [Proceedings of the National Academy of Sciences of the United States of America 14 (1928) 363-365] en el que también discute el concepto de efecto túnel sin nombrarlo explícitamente.
Aunque Gurney y Condon establecieron, como hemos comentado, una teoría similar a la de Gamow, cometieron dos errores. El primero es que avanzaron que la desintegración beta también podía explicarse con la misma teoría. Esto no es así ya que la desintegración beta se debe a procesos más complejos, como Gamow ya sabía entonces. La segunda equivocación fue que diferenciaron entre los procesos cuando la partícula alfa “sale” del núcleo (en la desintegración alfa) y cuando “trata de entrar en él” (en el experimento de Rutherford). En un trabajo publicado en febrero de 1929 [Physical Review 33 (1929) 127-140], Gurney y Condon descartaron la posibilidad de explicar, mediante la misma teoría, la aparición de radiactividad artificial tras el bombardeo de núcleos con partículas alfa. Pero Gamow había publicado en octubre de 1928 un trabajo titulado “Sobre la teoría cuántica de la fisión atómica” [Zeitschrift für Physik 52 (1928) 510-515] en el que aplicaba su teoría a ese proceso de manera que no sólo pudo explicar la ley de Geiger-Nuttall sino que, además, dió cuenta de las observaciones de Rutherford en su experimento y mostró el camino que unos años después, en 1932, permitió a los físicos Cockcroft (inglés) y Walton (irlandés) construir el primer acelerador de protones en Cambridge.
A decir de H.A. Bethe, otro gran físico alemán, premio Nobel de física en 1967, los dos trabajos de Gamow pueden considerarse como la primera aplicación exitosa de la teoría cuántica en el ámbito de la física nuclear.
En el artículo de agosto de 1928, Gamow, refiriéndose al modelo “de satélites” de Rutherford, decía textualmente: «Pero esta suposición parece muy poco natural y difícilmente puede ser la imagen verdadera.» Con apenas 24 años echaba por tierra una hipótesis de Rutherford, en aquel entonces la máxima referencia mundial en la física nuclear.