Chapitre 3 : La relativit´ e restreinte 3.1 La transformation de Galil´ ee et les difficult´ es de la physique pr´ erelativiste 3.2 Exp´ erience de Michelson-Morley et d´ etermination intuitive de la transformation de Lorentz 3.3 La transformation de Lorentz : approche standard 3.4 Dilatation du temps et contraction des longueurs 3.5 L’espace-temps de Minkowski et la distance spatio-temporelle 3.6 L’effet Doppler longitudinal 3.7 La m´ ecanique relativiste du point mat´ eriel 134
52
Embed
Chapitre 3 : La relativite restreinte´Chapitre 3 : La relativite restreinte´ 3.1 La transformation de Galilee et les difficult´ es de la physique pr´ ´erelativiste Considerons
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Chapitre 3 : La relativite restreinte
3.1 La transformation de Galilee et les difficultes de la physique prerelativiste
3.2 Experience de Michelson-Morley et determination intuitive
de la transformation de Lorentz
3.3 La transformation de Lorentz : approche standard
3.4 Dilatation du temps et contraction des longueurs
3.5 L’espace-temps de Minkowski et la distance spatio-temporelle
3.6 L’effet Doppler longitudinal
3.7 La mecanique relativiste du point materiel
134
Chapitre 3 : La relativite restreinte
3.1 La transformation de Galilee et les difficultes de la physique prerelativiste
Considerons deux systemes de reference d’inertie S et S en mouvement de translation recti-
ligne et uniforme l’un par rapport a l’autre (voir Figure 3.1). Chaque systeme est pourvu d’horloges
identiques aussi nombreuses qu’on voudra et toutes les horloges de S sont supposees synchro-
nisees, de meme que toutes les horloges de S. La synchronisation pourra se faire par exemple
a l’aide de tiges rigides qui permettent en principe a deux observateurs d’un meme systeme de
reference d’echanger des signaux a vitesse infinie. De plus, on admet, toujours en physique clas-
FIGURE 3.1 –
sique, que les horloges de S et les horloges de S peuvent etre synchronisees entre elles, ce qui
revient a admettre que si une horloge de S indique a un certain moment le meme temps que l’hor-
loge de S qui lui est voisine au moment en question, alors cette horloge de S indiquera toujours le
meme temps que l’horloge de S qui lui sera alors voisine et cela quels que soient les mouvements
de l’horloge de S consideree. Cette hypothese de synchronisation des horloges en mouvement
permet d’ecrire la relation
t = t
ou t et t designent les temps dans S et dans S d’un meme evenement, par exemple la collision
entre deux particules, c’est-a-dire les temps indiques lorsque l’evenement en question se produit
sur l’horloge de S et sur l’horloge de S qui se trouvent en ce moment au voisinage de l’endroit
de l’espace ou cet evenement a lieu. Cette derniere relation definit une des proprietes les plus
importantes du temps classique : son caractere absolu. Si on considere deux evenements 1 et 2 et
135
si on pose
∆t = t2 − t1 , ∆t = t2 − t1 ,
on a naturellement : ∆t = ∆t
comme consequence de la relation precedente ecrite pour chacun des deux evenements en ques-
tion. La duree d’un phenomene est donc une grandeur absolue. Il en est de meme de la notion
de simultaneite, car si les deux evenements en question sont simultanes dans S, c’est-a-dire si
∆t = 0, on a egalement ∆t = 0 et les deux evenements sont egalement simultanes dans S, quelles
que soient leurs localisations spatiales.
Soit alors ~V la vitesse, constante de S par rapport a S. Par un choix approprie des axes attaches
a S et a S, il est toujours possible de faire en sorte que les axes x et x glissent l’un sur l’autre et
que les axes y et y d’une part et z et z d’autre part restent constamment paralleles. On peut donc
ecrire 1 : x = x+ V t
y = y
z = z
t = t
(3.1)
en vertu de l’hypothese relative a la synchronisation des horloges en mouvement. Dans ces re-
lations, qui constituent la transformation de Galilee speciale, x, y, z, t et x, y, z, t designent les
coordonnees et le temps d’un meme evenement quelconque dans S et S, respectivement.
La transformation de Galilee generale est obtenue en considerant en plus une rotation et une
translation des axes dans chaque systeme de reference et une translation du temps. Sa forme est
ou ~a et b sont des constantes quelconques. Ou encore, en projetant l’equation vectorielle sur les
axes xi , en tenant compte de : ~ei = Aij ~je{xi = Aij(xj + Vj t+ aj)
t = t+ b(3.3)
Les transformations de Galilee speciales forment un groupe a un parametre et les transformations
de Galilee generales un groupe a dix parametres : Aij (3), Vi (3), ai (3), b (1).
Les lois de composition des vitesses et des accelerations resultent directement de la transfor-
mation de Galilee. Partant de la forme vectorielle, on a en effet, si on considere une particule en
1. En supposant que les horloges attachees en O et en O indiquent toutes deux le temps zero au moment ou elles
coıncident.
136
mouvement (succession continue d’evenements) :
~v =d~r
dt=d~r
dt=d~r
dt+ ~V = ~v + ~V (3.4)
et
~γ =d~v
dt=d~v
dt=d~v
dt= ~γ (3.5)
Ce dernier resultat conduit a l’invariance galileenne de la mecanique classique, c’est-a-dire a l’idee
que tous les systemes d’inertie sont rigoureusement equivalents du point de vue des phenomenes
mecaniques. En d’autres termes, les lois de la mecanique classique de Newton ont la meme forme
dans tous les systemes d’inertie (principe de relativite classique).
D’autre part, des la fin du XIX eme siecle, il devint clair que ce principe de relativite classique
ne semblait pas s’etendre aux phenomenes electromagnetiques et optiques, puisque les equations
de Maxwell (1831-1879), etablies en 1865, qui regissent ces phenomenes ne sont pas invariantes
par rapport aux transformations de Galilee, ou du moins ne seraient invariantes par rapport a ces
transformations des variables d’espace et de temps, que si l’on admettait pour le champ electromagneti-
que et pour les densites de charge et de courant des lois de transformation extremement com-
pliquees et inelegantes. En d’autres termes, il devint clair, et le premier a l’apercevoir tres distinc-
tement fut sans doute Poincare, qu’il existe une antipathie profonde entre les equations de Maxwell
et la transformation de Galilee.
Au cours du XIX eme siecle, cette antinomie etait resolue de facon plus ou moins explicite
en acceptant sans reserve la transformation de Galilee, et en admettant par consequent que les
lois de l’electromagnetisme n’avaient pas la meme forme dans tous les systemes d’inertie. Ainsi,
les equations de Maxwell n’etaient regardees comme rigoureusement valables que par rapport a un
certain systeme d’inertie privilegie que l’on supposait defini par l’ether, ce tres hypothetique milieu
materiel devant servir de support a la propagation des ondes electromagnetiques. C’est dans cet
esprit essentiellement mecaniste que toutes les experiences optiques et electromagnetiques etaient
alors interpretees, ce qui, dans la plupart des cas, donnait lieu soit a de tres reelles difficultes,
soit a la necessite de faire des hypotheses toujours tres artificielles sur les proprietes cinematiques
de l’ether : etait-il entraıne par la Terre, ou bien par les corps en mouvement, ou partiellement
entraıne ? etc.
En fait, la situation n’est pas simple et il ne peut etre question de discuter ici ces nombreuses
experiences dont l’etude releve d’un cours de physique generale (cf. E. Taylor et J.A. Wheeler,
1992, dans le livre SpaceTime Physics : introduction to special relativity, W.H. Freeman and Com-
pany, New York).
Mentionnons que dans certains cas, ces explications classiques paraissaient satisfaisantes : c’est
ce qui se passe pour le phenomene d’aberration decouvert par l’astronome Bradley en 1725 et
137
pour l’effet Doppler decouvert par Doppler en 1842. Dans d’autres cas, l’interpretation classique
est possible mais ne semble pas tres naturelle, car elle repose sur un certain degre d’entraınement
de l’ether par les corps en mouvement : c’est ce qui se passe par exemple dans l’experience de
Fizeau de 1851, dont nous dirons quelques mots plus loin. Enfin, dans le cas de l’experience de
Michelson-Morley, les difficultes d’interpretation furent beaucoup plus considerables. Le but de
cette experience, realisee par Michelson en 1881, puis par Michelson et Morley en 1887, etait de
mesurer la vitesse de l’ether par rapport a la Terre a l’aide d’un interferometre. Cette experience
decisive est decrite dans la section 3.2.
Le resultat remarquable obtenu par Michelson et Morley fut que l’ether est immobile par
rapport a la Terre. Une telle conclusion evidemment geocentrique parut cependant difficilement
defendable, et d’ailleurs en contradiction avec la theorie de l’aberration et avec l’experience de
Fizeau, de telle sorte qu’a la fin du XIX eme siecle, il devint evident que c’etait l’interpretation
classique de l’experience en question qui devait etre mise en cause.
Une premiere tentative d’interpretation fut d’abord proposee independamment par Fitzgerald
et par Lorentz en 1893 sous la forme d’une contraction longitudinale des corps en mouvement par
rapport a l’ether, mais cette hypothese n’eut que tres peu de succes (voir section 3.2).
Finalement, ce fut a Einstein (1879-1955) que revint le merite de clarifier completement la
situation grace a son celebre travail de 1905 publie dans les “Annalen der Physik”, sous la forme
d’un article intitule “Sur l’electrodynamique des corps en mouvement” (traduit en anglais dans
l’ouvrage The principle of relativity par Einstein, Lorentz, Weyl et Minkowski, 1923, Dover, New
York). Pour la premiere fois, du moins de facon tout a fait explicite, ce sont les notions classiques
d’ether et de cinematique galileenne qui sont ici definitivement condamnees et c’est une toute nou-
velle physique qui se trouve effectivement elaboree sur la base de deux postulats fondamentaux : le
principe de l’invariance de la vitesse de la lumiere dans le vide et le principe de relativite restreinte.
1) Principe de l’invariance de la vitesse de la lumiere dans le vide
Dans le vide, la vitesse de la lumiere est une constante universelle,
c = 2, 9979× 108 m/s ,
et possede donc la meme valeur dans tous les systemes d’inertie, quels que soient les mouvements
de la source lumineuse. De plus, la lumiere se propage dans le vide de facon rectiligne et uniforme,
par rapport a tout systeme d’inertie.
2) Principe de relativite restreinte
138
Toutes les lois de la physique (mecaniques, electromagnetiques, ...) doivent avoir la meme
forme dans tous les systemes d’inertie.
Le premier de ces principes, qui peut dans un certain sens etre considere comme une consequence
du second, implique evidemment une condamnation sans appel de la transformation de Galilee,
c’est-a-dire des notions classiques d’espace et de temps. C’est cela qui, par-dessus certaines polemi-
ques, doit etre regarde comme l’apport le plus important d’Einstein a la physique relativiste, car,
s’il est vrai de dire que les idees relativistes etaient dans l’air des la fin du XIX eme siecle et plus
particulierement dans les travaux de Lorentz (1853-1928) et de Poincare (1854-1912), il n’en reste
pas moins que ce fut bien Einstein qui par son article de 1905 fut le premier a comprendre de facon
tout a fait nette la necessite de rompre brutalement avec les vieilles idees relatives aux proprietes de
l’espace et du temps, comme en temoigne son principe de l’invariance de la vitesse de la lumiere
dans le vide, qu’il fut le premier et le seul a oser proposer. Il serait neanmoins injuste de ne pas
rappeler de nouveau les travaux de Lorentz relatifs a la structure des equations de Maxwell et peut-
etre plus encore ceux ou Poincare insiste sur l’antinomie existant entre la mecanique classique et
l’electromagnetisme et sur l’interet qu’il pourrait y avoir a creer une nouvelle mecanique qui serait
en harmonie avec l’electromagnetisme, de telle sorte que le principe de relativite soit applicable a
tous les phenomenes physiques et non plus seulement aux phenomenes mecaniques.
En 1955, Einstein ecrivait d’ailleurs, quelques mois avant sa mort :
”There is no doubt, that the special theory of relativity, if we regard its devopment in retrospect,
was ripe for development in 1905. Lorentz had already observed that for the analysis of Maxwell’s
equations the transformations which later were known by his name are essential, and Poincare had
even penetrated deeper in these connections. Concerning myself, I knew only Lorentz’s important
work of 1895 (”La theorie electromagetique de Maxwell” and ”Versuch einer Theorie der elektri-
schen und optischen Erscheinungen in bewegten Korpen”) but not Lorentz’s later work, nor the
consecutive investigations by Poincare. In this sense, my work of 1905 was independent. The new
feature of it was the realization of the fact that the bearing of the Lorentz-transformations trans-
cended their connection with Maxwell’s equations and was concerned with the nature of space and
time in general. A further new result was that the ”Lorentz invariance” is a general condition for
any physical theory. This was for me of particular importance because I had already previously
found that Maxwell’s theory did not account for the micro-structure of radiation and could there-
fore have no general validity”.
139
3.2 Experience de Michelson-Morley et determination intuitive de la trans-formation de Lorentz
La description de l’experience de Michelson-Morley ainsi que la determination intuitive de la
transformation de Lorentz seront effectuees dans le cadre des seances de travaux pratiques.
140
3.3 La transformation de Lorentz : approche standard
La relativite restreinte ne considere que des systemes de reference d’inertie rigoureusement
equivalents, quels que soient les phenomenes physiques consideres : soit le systeme de Copernic,
qui ne doit donc en aucune maniere etre regarde comme un systeme d’inertie privilegie, soit tout
systeme anime d’un mouvement de translation rectiligne et uniforme par rapport a lui ; c’est dans
ce sens qu’il faut comprendre le mot “restreinte”.
Un systeme d’inertie est encore considere comme etant une structure rigide pourvue d’horloges
identiques et synchronisees et le mouvement rectiligne et uniforme est naturellement defini comme
en physique classique. Ce qui est nouveau cependant, c’est la maniere dont on effectue la synchro-
nisation des horloges d’un meme systeme d’inertie, en utilisant des signaux lumineux (principe
de l’invariance de c) et non plus des regles supposees rigides ; ce qui est egalement nouveau, et
fondamental, c’est l’abandon du principe classique de synchronisation des horloges mobiles avec
celles au repos.
Considerons deux systemes d’inertie et choisissons les axes comme il est indique sur la figure
3.2. Toutes les horloges de S sont synchronisees entre elles et il en est de meme pour les horloges
FIGURE 3.2 –
de S. Nous pouvons egalement supposer que lorsque l’horloge de S qui est situee en O “coıncide”
avec l’horloge de S situee en O, ces deux horloges indiquent toutes les deux le temps 0. Bien
entendu nous ne supposons pas que l’horloge O indique toujours le meme temps que l’horloge de S
avec laquelle elle coıncide. Comme nous le verrons plus loin, il resulte du principe de l’invariance
de c que ceci est justement impossible : en d’autres termes, le principe de l’invariance de c entraıne
que la synchronisation des horloges mobiles est impossible (cf. plus loin la dilatation du temps).
Soit alors un evenement quelconque, c’est-a-dire quelque chose qui est parfaitement localise
dans l’espace et dans le temps, par exemple la collision entre deux particules ponctuelles, et soient
141
x, y, z, t et x, y, z et t les coordonnees d’espace et de temps de cet evenement dans les deux
systemes d’axes et d’horloges consideres.
Notre but est de rechercher les relations qui existent entre x, y, z, t et x, y, z, t en partant
du principe de l’invariance de c et du fait que la transformation de Galilee doit etre d’une certaine
maniere une forme approchee de ces relations. En d’autres termes, il faut modifier la transformation
de Galilee, mais aussi peu que possible, afin que la nouvelle transformation soit en accord avec le
principe d’invariance de c.
On a tout d’abord
y = y
z = z
puisque les plans x z et x z, d’une part, et x y et x y, d’autre part, sont identiques.
D’autre part, par analogie avec la transformation de Galilee, nous supposerons que x et t sont
des fonctions lineaires 2 de x et de t, c’est-a-dire que l’on a 3
x = ax+ bt
t = fx+ gt
ou a, b, f et g designent quatre constantes a determiner 4.
Montrons maintenant que ces quatre constantes sont parfaitement determinees par le principe
de l’invariance de c.
Considerons tout d’abord l’ensemble des evenements localises en O, c’est-a-dire le mouvement
ou l’histoire de O. Pour ces evenements :
x = y = z = 0 ,
2. Le caractere lineaire de la transformation en question entraıne evidemment l’invariance du mouvement rectiligne
et uniforme, c’est-a-dire que si une particule est animee par rapport a S d’un mouvement rectiligne et uniforme (x,
y, z fonctions lineaires de t), alors cette particule est egalement animee par rapport a S d’un mouvement rectiligne et
uniforme, puisqu’en vertu de la transformation lineaire en cause, x, y, z sont alors des fonctions lineaires de t. Bien
entendu, ces mouvements sont caracterises par des vitesses en general differentes ; mais dans le cas ou la particule est
un photon, ces deux vitesses sont egales en module. En d’autres termes, la linearite postulee ici entraıne l’invariance
du mouvement rectiligne et uniforme, tout comme en mecanique classique et est donc en particulier compatible avec
le principe selon lequel la lumiere (photons) se propage dans le vide selon des mouvements rectilignes et uniformes,
quel que soit le systeme d’inertie considere.3. Ces relations sont homogenes a cause de nos hypotheses sur le choix des axes et des horloges. Il suffit pour le
voir de considerer l’evenement “coıncidence de O et de O”.4. Constantes qui sont donc les memes pour tous les evenements, mais qui dependent evidemment de la vitesse
relative V des deux systemes consideres.
142
et par suite :
x = b t
t = g t
ou encore
x =b
gt .
On a donc, d’apres la definition de V ,b
g= V
Considerons ensuite le mouvement d’une particule quelconque, c’est-a-dire la succession conti-
nue des evenements qui constituent l’histoire de la particule. Portons notre attention sur deux de
ces evenements, supposes infiniment voisins :
E : x, y, z, t ; x, y, z, t
E ′ : x+ ∆x, etc. ; x+ ∆x, etc.
On a naturellement 5
~v = lim
(∆x
∆t,∆y
∆t,∆z
∆t
)et
~v = lim
(∆x
∆t,∆y
∆t,∆z
∆t
)lorsque E ′ tend vers E.
Si nous ecrivons les relations generales :
x = ax+ bt
y = y
z = z
t = fx+ gt
pour l’evenement E et pour l’evenement E ′ et si nous soustrayons membre a membre, nous obte-
nons evidemment∆x = a∆x+ b∆t
∆y = ∆y
∆z = ∆z
∆t = f∆x+ g∆t
5. On remarquera que ~v et ~v sont les vitesses de la particule au meme evenement E.
143
a cause du caractere lineaire des relations en cause. Des lors, il vient :
∆x
∆t=a
∆x
∆t+ b
f∆x
∆t+ g
∆y
∆t=
∆y
∆t
f∆x
∆t+ g
∆z
∆t=
∆z
∆t
f∆x
∆t+ g
En passant a la limite, on obtient donc les relations :
vx =avx + b
f vx + g
vy =vy
fvx + g
vz =vz
fvx + g
qui constituent la loi relativiste de composition des vitesses 6.
Elevant ces trois equations au carre et additionnant :
v2 =v2 + (a2 − 1)v2
x + 2abvx + b2
(fvx + g)2.
Dans le cas d’un photon (quantum de lumiere) se propageant dans le vide, cette relation devient :
c2 =c2 + (a2 − 1)v2
x + 2abvx + b2
(fvx + g)2.
en vertu du principe de l’invariance de c. Cette derniere equation s’ecrit encore :
(a2 − 1)v2x + 2abvx + b2 + c2 = c2(f 2v2
x + 2fgvx + g2)
et doit etre identiquement satisfaite quel que soit vx puisque la direction de ~v est tout a fait arbi-
traire 7 .
6. Sous forme vectorielle :
~v =~v + [(a− 1) ~v·
~VV + b]
~VV
f ~v·~VV + g
.7. −c ≤ vx ≤ c
144
On a donc :a2 − 1 = c2f 2
ab = c2fg
b2 + c2 = c2g2.
Reciproquement, ces dernieres relations entraınent le principe de l’invariance de c, en ce sens
que v = c entraıne alors bien v = c.
En resume, la transformation :x = ax+ bt
y = y
z = z
t = fx+ gt
entraıne une loi de composition des vitesses qui est compatible avec le principe d’invariance de c
si et uniquement si les quatre constantes a, b, f et g obeissent aux relations :
a2 − 1 = c2f 2
ab = c2fg
b2 + c2 = c2g2.
Compte tenu deb
g= V
et de la condition naturelle :
limV→0
(a b
f g
)=
(1 0
0 1
)qui permet de determiner les signes univoquement, ces trois conditions donnent pour a, b, f et g la
solution unique :
a =1√
1− V 2
c2
, b =V√
1− V 2
c2
,
f =Vc2√
1− V 2
c2
, g =1√
1− V 2
c2
.
Cette solution implique que V doit toujours etre inferieur a c, en accord avec l’idee relativiste
selon laquelle c est une vitesse limite, qu’aucun corps materiel ne saurait atteindre, ni bien entendu
depasser.
145
En definitive, la transformation qui se substitue a la transformation de Galilee et qui porte le
nom de transformation de Lorentz est 8
x =x+ V t√1− V 2
c2
y = y
z = z
t =Vc2x+ t√
1− V 2
c2
(3.6)
On remarquera qu’elle depend de c et qu’elle tend vers la transformation de Galilee lorsqu’on y
fait formellement tendre c vers l’infini.
La transformation de Lorentz etait en fait connue depuis plusieurs annees lorsqu’Einstein la
redecouvrit en 1905 a partir de son principe de l’invariance de c, en suivant une demonstration qui
est essentiellement celle donnee ci-dessus. En 1877, Voigt utilise deja la transformation de Lorentz
dans la theorie elastique de la lumiere, en constatant que cette transformation laisse l’equation de
d’Alembert :∂2ψ
∂x2+∂2ψ
∂y2+∂2ψ
∂z2− 1
c2
∂2ψ
∂t2= 0
invariante (en forme) si ψ est lui-meme invariant (en nombre). En 1899, Lorentz decouvre que
les equations de Maxwell sont egalement invariantes (en forme) par rapport a cette meme trans-
formation, si on admet que le champ electromagnetique et les densites de charge et de courant se
transforment selon certaines lois appropriees. La transformation de Lorentz fut egalement utilisee
par la suite par Larmor et Poincare, mais toujours comme un simple outil mathematique, sans si-
gnification physique vraiment fondamentale 9. Lorentz employait par exemple la transformation de
Galilee et la transformation de Lorentz simultanement et distinguait soigneusement les variables
8. Sous forme vectorielle, on a, avec ~r = ~OP et ~r = ~PO,
~r = ~r +
(1−
√1− V 2
c2
)~V · ~rV 2
+ t√1− V 2
c2
~V
t =
~V · ~rc2
+ t√1− V 2
c2
Cette forme a naturellement l’avantage de ne plus dependre de l’hypothese faite ci-dessus sur le choix des axes.9. La transformation etudiee par Lorentz en 1899 n’etait en fait que la transformation de Lorentz ecrite au premier
ordre enV
c. Les termes du second ordre furent obtenus par Larmor en 1900 et la transformation de Lorentz exacte par
Lorentz en 1903
146
d’espace et de temps figurant dans ces deux transformations : “coordonnees et temps physiques”
et “coordonnees et temps locaux”, respectivement.
Ce n’est qu’en 1905, avec Einstein, que la transformation de Lorentz prit toute son importance,
puisqu’il devint clair alors que cette transformation etait en realite la veritable transformation phy-
sique reliant les observations d’espace et de temps effectuees dans differents systemes d’inertie
sur un meme evenement quelconque. En d’autres termes, que la transformation de Lorentz devait
prendre la place de la transformation de Galilee et s’etendre ainsi a toute la physique.
L’inverse de la transformation de Lorentz s’obtient simplement en barrant et debarrant et en
changeant le signe de V . (On justifie aisement ce resultat en considerant le mouvement de O et en
remarquant que la vitesse de S par rapport a S est −~V ). On a alors :
x =x− V t√
1− V 2
c2
y = y
z = z
t =t− V
c2x√
1− V 2
c2
(3.7)
Les transformations de Lorentz considerees jusqu’ici sont dites speciales, puisqu’elles ont ete
obtenues en faisant certaines hypotheses (non essentielles) sur les axes et sur les horloges. On
obtient la transformation generale de Lorentz en combinant cette transformation speciale avec une
rotation et une translation des axes et avec une translation du temps. Si on se rappelle la forme
vectorielle donnee en bas de la page 146, il est clair que la transformation de Lorentz generale peut
s’ecrire sous la forme vectorielle suivante :
~r = ~r +
[(γ − 1)
~V · ~rV 2
+ γt
]~V + ~a
t = γ
(~V · ~rc2
+ t
)+ b
(3.8)
ou encore, en projetant l’equation vectorielle sur les axes xi :
xi = Aij
[xj +
[(γ − 1)
VkxkV 2
+ γt
]Vj + aj
]
t = γ
[Vkxkc2
+ t
]+ b
(3.9)
147
avec :
γ =1√
1− V 2/c2(3.10)
Si on fait tendre c vers l’infini dans (3.8) et (3.9), on retrouve evidemment la transformation de
Galilee generale sous forme vectorielle (3.2) et projetee sur les axes xi (3.3), respectivement.
Les transformations de Lorentz speciales forment un groupe a un parametre (V ) tandis que les
transformations de Lorentz generales forment un groupe a dix parametres : Aij (3), Vi (3), ai (3), b
(1).
En fait, la loi de composition du groupe de Lorentz, dans le cas des transformations speciales
aussi bien que generales, n’est plus la loi galileenne d’addition des vitesses, mais bien la loi rela-
tiviste de composition des vitesses qui, dans le cas general, compte tenu du resultat obtenu au bas
de la page 144 et des valeurs des quatre constantes a, b, f et g trouvees precedemment, s’ecrit :
~v =
√1− V 2
c2~v +
[1 +
(1−
√1− V 2
c2
)~V ·~vV 2
]~V
1 +~V ·~vc2
(3.11)
Cette expression se reduit bien a la loi de composition classique c’est-a-dire (3.4) si on y fait tendre
formellement c vers l’infini, c’est-a-dire en pratique si V et v sont beaucoup plus petits que c. On
remarquera encore que l’on a bien : ~v = ~v si ~V = 0, et ~v = ~V si ~v = 0.
De plus, on a
v2 − c2 =1− V 2
c2(1 +
~V ·~vc2
)2 (v2 − c2)
de sorte que v = c entraıne bien v = c, et v < c, v < c.
Lorsque tous les mouvements s’effectuent dans la meme direction, la loi de composition rela-
tiviste des vitesses se simplifie comme suit :
v =v + V
1 + vVc2
(3.12)
Il est d’ailleurs possible de demontrer directement cette relation a partir de la transformation de
Lorentz speciale (3.6) et des definitions de ~v et ~v.
En 1851, Fizeau realisa une experience interferometrique destinee a mesurer la vitesse par
rapport a la Terre d’un faisceau lumineux se propageant dans un liquide, lui-meme en mouvement
par rapport a la Terre. Le dessin 3.3 rappelle schematiquement le principe de cette experience. Si v
designe la vitesse du faisceau considere par rapport a la Terre et v sa vitesse par rapport au liquide,
et puisque tous les mouvements s’effectuent ici selon la meme direction, la loi de composition des
148
FIGURE 3.3 –
vitesses relativistes (3.12) nous permet d’ecrire 10
v =c
n(1 +
nV
c)(1 +
V
nc)−1
compte tenu de
v =c
n
ou n designe l’indice de refraction du liquide considere. Ou encore, approximativement, puisque
n est de l’ordre de l’unite et V/c beaucoup plus petit que l’unite :
v =c
n+ (1− 1
n2)V
qui est exactement la loi experimentale obtenue par Fizeau. Bien entendu, en 1851, l’interpretation
de cette loi experimentale s’effectuait en recourant a la loi de composition galileenne des vitesses
et a la notion d’ether : il en resultait que l’ether, a l’interieur du liquide, etait entraıne par le liquide
mais seulement de facon partielle, puisque sa vitesse par rapport a la Terre semblait etre 11
(1− 1
n2)V
et sa vitesse par rapport au liquide
− Vn2
L’image classique etait donc la suivante (cf. Figure 3.4) :
Vitesse de la lumiere par rapport a l’ether : c/n
10. v et v sont inferieurs a c, mais naturellement de l’ordre de c.11. c
n etait alors la vitesse de la lumiere par rapport a l’ether et non pas par rapport au liquide, comme c’est
reellement le cas.
149
FIGURE 3.4 –
Vitesse de l’ether par rapport au liquide : −V/n2
Vitesse du liquide par rapport a la Terre : V
Vitesse de la lumiere par rapport a la Terre (cinematique classique) : c/n− V/n2 + V
Bien entendu, l’image relativiste est considerablement plus simple (cf. Figure 3.5).
FIGURE 3.5 –
Vitesse de la lumiere par rapport au liquide : c/n
Vitesse du liquide par rapport a la Terre : V
Vitesse de la lumiere par rapport a la Terre (cinematique relativiste) :cn
+ V
1 + Vnc
' c
n+ (1− 1
n2)V
Mais cette simplicite n’a pu etre obtenue que par un bouleversement profond des idees clas-
siques d’espace et de temps et par l’abandon de la notion d’ether, conformement au principe de la
150
relativite restreinte. 12
Quant a la loi de composition des accelerations, elle s’obtient sans difficulte en derivant la
loi de composition des vitesses (3.11) par rapport a t et en utilisant l’expression de t donnee par
le seconde relation (3.8). La relation ainsi obtenue est relativement compliquee et, bien entendu,
differente de la loi de composition classique (3.5) ~γ = ~γ, c’est-a-dire que l’on a, en general, en
relativite
~γ 6= ~γ
ce qui implique, en vertu du principe de relativite restreinte, une condamnation capitale de la
mecanique newtonienne. Ainsi, pour le cas de la transformation speciale de Lorentz, on peut
aisement calculer l’expression de l’acceleration γ en fonction de γ
γ =dv
dt, γ =
dv
dt=dv/dt
dt/dt
En nous servant des relations de transformation speciale inverses de celles donnees en (3.7) et
(3.12), nous trouvons successivement
dv
dt=
dvdt
(1− vVc2
) + (v − V )dvdtVc2
(1− vVc2
)2
dv
dt= γ
1− V 2
c2
(1− vVc2
)2
dt
dt=
1− vVc2√
(1− V 2
c2)
et donc, finalement,
γ = γ(
√1− V 2
c2
1− vVc2
)3
confirmant qu’en general γ 6= γ. A partir de la relation precedente etablie pour le cas d’une
transformation de Lorentz speciale, on remarque que γ = 0 implique γ = 0, et vice-versa. On
peut aussi montrer pour le cas des transformations de Lorentz generales que si ~γ = 0, on a encore
~γ = 0, conformement a l’invariance du mouvement rectiligne et uniforme.
Ainsi donc, en relativite restreinte – tout comme en mecanique newtonienne – une particule
depourvue d’acceleration dans un referentiel d’inertie possede la meme propriete dans tous les
referentiels d’inertie. De facon semblable, une particule acceleree dans un referentiel d’inertie le
reste dans tous les referentiels d’inertie, bien qu’en relativite restreinte, la valeur de l’acceleration
12. En physique prerelativiste, l’ether etait non seulement, comme on l’a souvent dit, le sujet du verbe onduler,
en parlant de la lumiere ou de toute onde electromagnetique, mais c’etait aussi un systeme d’inertie privilegie et
inevitable. L’interpretation classique de la formule de Fizeau exige par exemple que l’on fasse appel a lui.
151
soit differente d’un systeme de reference d’inertie a l’autre. Ainsi donc, en relativite restreinte,
l’acceleration continue de posseder un certain caractere absolu.
Ce ne sera qu’en relativite generale, que l’acceleration perdra a son tour ce caractere absolu.
En effet, en relativite generale, il n’existe pas de systemes de reference privilegies, qu’ils soient
d’inertie ou acceleres : tous les systemes de reference y sont par principe equivalents.
152
3.4 Dilatation du temps et contraction des longueurs
a. La dilatation du temps
Considerons la situation decrite sur la figure 3.6 ou les deux horloges de S sont evidemment
synchronisees. Soient E1 la coıncidence de l’horloge H avec H1 et E2 la coıncidence de H avec
H2.
FIGURE 3.6 –
En vertu de la transformation de Lorentz speciale (3.6), on a pour tout evenement :
x =x+ V t√1− V 2
c2
, t =Vc2x+ t√
1− V 2
c2
Ecrivant ces relations pour E2 et pour E1, et soustrayant, il vient, avec des notations evidentes,
∆x =∆x+ V∆t√
1− V 2
c2
, ∆t =Vc2
∆x+ ∆t√1− V 2
c2
Or, les deux evenements consideres sont colocaux dans S :
∆x = 0
Des lors :
∆x =V∆t√1− V 2
c2
, ∆t =∆t√
1− V 2
c2
153
La relation
∆t =∆t√
1− V 2
c2
(3.13)
exprime le phenomene de dilatation du temps :
∆t > ∆t
Imaginons en effet un phenomene physique localise dans S au voisinage de H et supposons que
ce phenomene commence en E1 et finisse en E2. ∆t est la duree propre de ce phenomene et ∆t
la duree de ce meme phenomene telle qu’elle apparaıt a l’observateur S. La dilatation du temps
resulte de ce que l’on a :
duree relative > duree propre
dans le rapport 1/
√1− V 2
c2.
Ce phenomene de dilatation du temps implique evidemment que la synchronisation des hor-
loges mobiles n’est pas possible en relativite restreinte, comme le montre l’exemple ci-dessous (cf.
Figure 3.7) :
FIGURE 3.7 –
Une application bien connue de ce phenomene de la dilatation du temps est relative a l’observa-
tion au niveau du sol de certaines particules instables produites par le rayonnement cosmique a une
154
altitude d’environ 10 km. C’est le cas par exemple pour le muon µ qui possede une vie moyenne
propre :
∆t = 2× 10−6s
ainsi qu’il resulte de mesures de laboratoire. Mais les muons µ, crees au sommet de l’atmosphere
par le rayonnement cosmique, possedent par rapport a la Terre S des vitesses presque egales a c.
Par exemple :V
c= 0, 99995 ,
√1− V 2
c2= 10−2 .
La duree de vie apparente de ces muons est donc :
∆t =∆t√
1− V 2
c2
= 2× 10−4s
par rapport a la Terre.
Entre leur creation au sommet de l’atmosphere et leur desintegration, ces muons peuvent donc
parcourir par rapport a la Terre une distance egale a :
∆x = V∆t = 60 km
conformement a l’observation. Si on ne tenait pas compte de la dilatation du temps, on obtiendrait
600 m au lieu de 60 km, et on ne pourrait pas comprendre que les muons, crees a 10 km d’altitude,
soient observes au niveau du sol.
b. La contraction des longueurs
Une regle rigide AB fixe dans S est en mouvement de translation rectiligne uniforme et lon-
gitudinal par rapport a S (voir Figure 3.8). La longueur propre de la regle, l, est la distance AB
mesuree dans S, par exemple a l’aide d’une horloge et d’une source lumineuse placees en A et
d’un miroir place en B. D’autre part, il est egalement possible de definir la longueur l de la regle
relativement a S en procedant comme suit. Considerons le long de l’axe x une infinite d’horloges
fixes dans S et naturellement synchronisees.
En un meme instant t, quelconque mais fixe a l’avance, une de ces horloges, soit A, voit A en
face d’elle et de meme, en ce meme instant t, une autre horloge, soit B, voit B en face d’elle. La
longueur de la regle relativement a S, l, est alors par definition la distance mesuree dans S entre A
et B qui sont deux points fixes de S. Il est clair qu’il n’y a aucune raison pour que l et l soient a
priori egales. Pour trouver la relation entre l et l, considerons l’evenement E1 “coıncidence de A
155
FIGURE 3.8 –
et de A” et l’evenement E2 “coıncidence de B et de B”. On a :
∆x =∆x+ V∆t√
1− V 2c2
, ∆t =Vc2
∆x+ ∆t√1− V 2
c2
et aussi ∆t = 0.
Par consequent :
∆x =
√1− V 2
c2∆x (3.14)
c’est-a-dire :
l =
√1− V 2
c2l. (3.15)
On peut donc dire que pour S, la regle semble plus courte qu’elle est en realite, puisque
longueur relative < longueur propre
dans le rapport de
√1− V 2
c2a 1.
Ce phenomene de contraction des longueurs n’implique evidemment pas une modification in-
trinseque de la regle 13. Il resulte du fait que la longueur propre et la longueur relative sont definies
selon des processus operationnels tout a fait differents, qui conduisent a des resultats de mesures
differents, en vertu de la transformation de Lorentz. Ceci ne signifie nullement que la contraction
des longueurs et la dilatation du temps soient des phenomenes que nous devions regarder comme
evidents. Ils sont au contraire l’expression des proprietes relativistes de l’espace et du temps, c’est-
a-dire des regles rigides, des horloges et de la lumiere, et ces proprietes bien qu’elles ne soient
nullement illogiques ou absurdes, heurtent neanmoins fortement notre intuition, formee au contact
13. Contrairement a la contraction postulee par Lorentz et Fitzgerald en 1893, qui resultait d’une certaine interaction
physique entre les molecules de la regle et les ”molecules de l’ether”, cf. section 3.2.
156
d’une experience rudimentaire dans laquelle les vitesses V sont toujours beaucoup plus petites que
c, de sorte que le facteur de dilatation et de contraction est en pratique indiscernable de l’unite.
Revenons en a l’application interessante des muons µ observes au niveau du sol (cf. section
3.3.a). En effet, un observateur lie a un muon admettra que le temps de vie du muon est egal a
∆t = 2 × 10−6s. Pour lui, la Terre se rapproche avec une vitesse pratiquement egale a c. On ne
comprend pas a priori comment le muon pourra parcourir plus de 600m. Toutefois, en accord avec
la contraction des longueurs discutee ci-avant, la hauteur de l’atmosphere terrestre se contracte
pour lui. Si l’observateur terrestre estime que la distance (propre) a parcourir est l = 60km, elle
se reduit pour le muon a l =√
(1− (v/c)2l ' 600m. Le temps ∆t = 2 × 10−6s lui suffit donc
pour atteindre la surface de la Terre, puisque celle-ci se rapproche de lui avec une vitesse proche
de celle de la lumiere (c), de telle maniere que c∆t = 600m.
157
3.5 L’espace-temps de Minkowski et la distance spatio-temporelle
On doit a Minkowski une geometrisation de la relativite restreinte qui est de la plus grande
importance du point de vue de la visualisation et de la geometrisation de la theorie (relativite
generale, theories unifiees des diverses interactions physiques, ...).
Il s’agit en fait d’utiliser un langage geometrique fonde sur l’image d’un espace abstrait a
quatre dimensions, que l’on appelle espace-temps, dont les points representent les evenements. En
d’autres termes, un evenement est represente par un point de l’espace-temps et l’espace-temps est
regarde comme etant l’ensemble des evenements. D’autre part, un observateur S (c’est-a-dire un
systeme d’axes et un systeme d’horloges synchronisees attaches a un systeme d’inertie) caracterise
un evenement quelconque a l’aide des coordonnees d’espace et de temps :
xα = (ct, x, y, z) (3.16)
Ces quatre nombres 14 peuvent donc etre consideres comme etant les coordonnees du point-evenement
en question dans un systeme de coordonnees bien determine de l’espace-temps, dit de Minkowski.
Ainsi, si l’espace-temps de Minkowski est designe par E4, nous avons les relations :Evenement : point de E4
Observateur : systeme de coordonnees de E4
qui correspondent simplement a l’idee physique selon laquelle l’evenement est absolu 15, tandis
que ses coordonnees sont relatives a un observateur donne.
Nous avons introduit dans (3.16) pour la premiere fois la notation indicielle propre au calcul
tensoriel (qui sera aussi utilisee dans l’etude des espaces plats en coordonnees curvilignes et des
espaces riemanniens (courbes) propres a la relativite generale) : l’indice α – ainsi d’ailleurs que
tout indice grec – prendra les valeurs (0, 1, 2, 3), l’indice ”0” etant conventionnellement associe a
la coordonnee temporelle (x0 = ct), les indices i = 1, 2, 3 correspondant aux coordonnees spatiales
xi (x1 = x, x2 = y, x3 = z). On notera aussi la position superieure (dite contravariante) de l’indice
α, correspondant, suivant la convention adoptee, au caractere vectoriel du quadri-vecteur position
(spatio-temporelle), dont les quatre composantes sont donnees par (3.16).
Si on considere, a present, un evenement E et deux observateurs S et S, la transformation de
Lorentz speciale qui lie les coordonnees respectives xα et xβ (cf. (3.6)) peut s’ecrire sous la forme
14. La coordonnee temporelle t a ete multipliee par la vitesse de la lumiere c afin que les quatre coordonnees
spatio-temporelles aient les memes dimensions physiques.15. Avant la theorie de la relativite, le temps etait considere comme absolu et peut donc etre imagine comme formant
une ”droite” independante de l’observateur. En revanche, l’espace, meme en physique classique, ne possede pas ce
caractere absolu puisque, par exemple, deux evenements non simultanes et colocaux pour un observateur peuvent etre
percus comme se produisant en des endroits distincts par un autre observateur.
158
compacte comme suit :
xα =3∑
β=0
∧αβxβ (3.17)
ou encore, en adoptant la convention de sommation d’Einstein, selon laquelle lorsqu’une expres-
sion contient un indice en position superieure et le meme indice en position inferieure, la som-
mation sur cet indice est sous-entendue sur toutes les valeurs possibles de cet indice (ici, l’indice
β) :
xα = Λαβx
β (3.18)
Les quantites {Λαβ} constituent une collection de 16 nombres qui forment la matrice de transfor-
mation de Lorentz (speciale) qui s’ecrit explicitement sous la forme suivante 16 (cf. (3.6)) :
Λαβ =
γ γβ 0 0
γβ γ 0 0
0 0 1 0
0 0 0 1
(3.19)
avec γ donne par (3.10) et :
β =V
c(3.20)
Dans le cas d’une transformation de Lorentz generale, definie dans la section 3.3, la relation
(3.18) peut etre generalisee et peut s’ecrire
xα = Λαβ x
β +Mα (3.21)
ou la matrice de transformation de Lorentz generale est donnee par l’expression suivante (cf.
(3.9)) :
Λαβ =
γ γ
Vjc
γAikVkc
Aij + (γ − 1)AikVkVjV 2
(3.22)
et le quadri-vecteur constant Mα par
Mα =
(b c
Aikak
)(3.23)
Considerons maintenant deux evenements, E1 et E2 et deux observateurs S et S :
E1 : xα(1), xα(1)
16. Attention a l’utilisation quelque peu ambigue du symbole β pour designer deux choses distinctes (indices et
rapport V/c) !
159
E2 : xα(2), xα(2)
Posons :∆xα = xα(2)− xα(1)
∆xα = xα(2)− xα(1)(3.24)
∆xα et ∆xα sont les composantes du 4-vecteur−−−→E1E2 dans les deux systemes d’axes consideres.
Puisque, compte tenu de (3.21) :
xα(2) = Λαβ x
β(2) +Mα
xα(1) = Λαβ x
β(1) +Mα
il vient, par soustraction
∆xα = Λαβ∆xβ (3.25)
qui n’est autre que la loi de transformation des composantes ∆xα du 4-vecteur dans l’espace de
Minkowski E4. Suivant que l’on considere une transformation de Lorentz speciale ou generale, il
y a lieu d’utiliser dans (3.25) la forme (3.19) ou (3.22) respectivement pour la matrice de Lorentz
Λαβ.
Formons a partir de (3.25) la quantite scalaire ∆s2 definie comme suit :
∆s2 = ηαβ∆xα∆xβ = ηαβΛαµΛβ
ν∆xµ∆xν (3.26)
(avec dans le second membre une quadruple sommation sur les indices α, β, µ et ν) ou ηαβ (α, β =
0, 1, 2, 3) est un symbole de Kronecker generalise, dote des proprietes suivantes :
ηoo = −1
ηoi = 0
ηio = 0
ηij = δij
(3.27)
Dans ce cas, le developpement de l’expression (3.26) de ∆s2 en termes de ∆xα donne le
resultat suivant :
∆s2 = −c2(∆t)2 + (∆x)2 + (∆y)2 + (∆z)2 (3.28)
De plus, on peut montrer que :
ηαβ Λαµ Λβ
ν ∆xµ∆xν
peut se mettre sous la forme :
−c2(∆t)2 + (∆x)2 + (∆y)2 + (∆z)2
160
aussi bien dans le cas d’une transformation de Lorentz speciale que generale.
Verifions-le dans le cas de la transformation speciale caracterisee par la matrice de Lorentz
(3.19). On a alors :
ηαβΛαµΛβ
ν∆xµ∆xν = η00Λ0
µΛ0ν∆x
µ∆xν + ηi0ΛiµΛ0
ν∆xµ∆xν
+ η0jΛ0µΛj
ν∆xµ∆xν + ηijΛ
iµΛj
ν∆xµ∆xν
= − [γ2c2(∆t)2 + 2γ2βc∆t∆x+ γ2β2(∆x)2]
+ [γ2β2c2(∆t)2 + 2γ2βc∆t∆x+ γ2(∆x)2]
+ (∆y)2 + (∆z)2
= − c2(∆t)2 + (∆x)2 + (∆y)2 + (∆z)2
Si ∆xα et ∆xα sont relies par la matrice (3.22), l’invariance du ∆s2 decoule immediatement
du calcul ci-dessus si l’on remarque que les rotations des axes spatiaux ainsi que les translations
des axes spatiaux et temporel qui differencient les transformations de Lorentz generales des trans-
formations speciales laissent invariantes separement les quantites (∆x)2 +(∆y)2 +(∆z)2 et (∆t)2.
Nous avons ainsi mis en evidence l’invariance de la quantite ∆s2 = ηαβ ∆xα∆xβ vis-a-vis
d’une transformation de Lorentz (speciale ou generale), qui se traduit explicitement sous la forme