Chapitre 3 : La relativite restreinteĆhapitre 3 : La relativite restreinte´ 3.1 La transformation de Galilee et les difficult´ es de la physique pr´ érelativiste Considerons

Chapitre 3 : La relativite restreinte

3.1 La transformation de Galilee et les difficultes de la physique prerelativiste

3.2 Experience de Michelson-Morley et determination intuitive

de la transformation de Lorentz

3.3 La transformation de Lorentz : approche standard

3.4 Dilatation du temps et contraction des longueurs

3.5 L’espace-temps de Minkowski et la distance spatio-temporelle

3.6 L’effet Doppler longitudinal

3.7 La mecanique relativiste du point materiel

134

Chapitre 3 : La relativite restreinte

3.1 La transformation de Galilee et les difficultes de la physique prerelativiste

Considerons deux systemes de reference d’inertie S et S en mouvement de translation recti-

ligne et uniforme l’un par rapport a l’autre (voir Figure 3.1). Chaque systeme est pourvu d’horloges

identiques aussi nombreuses qu’on voudra et toutes les horloges de S sont supposees synchro-

nisees, de meme que toutes les horloges de S. La synchronisation pourra se faire par exemple

a l’aide de tiges rigides qui permettent en principe a deux observateurs d’un meme systeme de

reference d’echanger des signaux a vitesse infinie. De plus, on admet, toujours en physique clas-

FIGURE 3.1 –

sique, que les horloges de S et les horloges de S peuvent etre synchronisees entre elles, ce qui

revient a admettre que si une horloge de S indique a un certain moment le meme temps que l’hor-

loge de S qui lui est voisine au moment en question, alors cette horloge de S indiquera toujours le

meme temps que l’horloge de S qui lui sera alors voisine et cela quels que soient les mouvements

de l’horloge de S consideree. Cette hypothese de synchronisation des horloges en mouvement

permet d’ecrire la relation

t = t

ou t et t designent les temps dans S et dans S d’un meme evenement, par exemple la collision

entre deux particules, c’est-a-dire les temps indiques lorsque l’evenement en question se produit

sur l’horloge de S et sur l’horloge de S qui se trouvent en ce moment au voisinage de l’endroit

de l’espace ou cet evenement a lieu. Cette derniere relation definit une des proprietes les plus

importantes du temps classique : son caractere absolu. Si on considere deux evenements 1 et 2 et

135

si on pose

∆t = t2 − t1 , ∆t = t2 − t1 ,

on a naturellement : ∆t = ∆t

comme consequence de la relation precedente ecrite pour chacun des deux evenements en ques-

tion. La duree d’un phenomene est donc une grandeur absolue. Il en est de meme de la notion

de simultaneite, car si les deux evenements en question sont simultanes dans S, c’est-a-dire si

∆t = 0, on a egalement ∆t = 0 et les deux evenements sont egalement simultanes dans S, quelles

que soient leurs localisations spatiales.

Soit alors ~V la vitesse, constante de S par rapport a S. Par un choix approprie des axes attaches

a S et a S, il est toujours possible de faire en sorte que les axes x et x glissent l’un sur l’autre et

que les axes y et y d’une part et z et z d’autre part restent constamment paralleles. On peut donc

ecrire 1 : x = x+ V t

y = y

z = z

t = t

(3.1)

en vertu de l’hypothese relative a la synchronisation des horloges en mouvement. Dans ces re-

lations, qui constituent la transformation de Galilee speciale, x, y, z, t et x, y, z, t designent les

coordonnees et le temps d’un meme evenement quelconque dans S et S, respectivement.

La transformation de Galilee generale est obtenue en considerant en plus une rotation et une

translation des axes dans chaque systeme de reference et une translation du temps. Sa forme est

donc, en ecriture vectorielle : {~r = ~r + ~V t+ ~a

t = t+ b(3.2)

ou ~a et b sont des constantes quelconques. Ou encore, en projetant l’equation vectorielle sur les

axes xi , en tenant compte de : ~ei = Aij ~je{xi = Aij(xj + Vj t+ aj)

t = t+ b(3.3)

Les transformations de Galilee speciales forment un groupe a un parametre et les transformations

de Galilee generales un groupe a dix parametres : Aij (3), Vi (3), ai (3), b (1).

Les lois de composition des vitesses et des accelerations resultent directement de la transfor-

mation de Galilee. Partant de la forme vectorielle, on a en effet, si on considere une particule en

1. En supposant que les horloges attachees en O et en O indiquent toutes deux le temps zero au moment ou elles

coıncident.

136

mouvement (succession continue d’evenements) :

~v =d~r

dt=d~r

dt=d~r

dt+ ~V = ~v + ~V (3.4)

et

~γ =d~v

dt=d~v

dt=d~v

dt= ~γ (3.5)

Ce dernier resultat conduit a l’invariance galileenne de la mecanique classique, c’est-a-dire a l’idee

que tous les systemes d’inertie sont rigoureusement equivalents du point de vue des phenomenes

mecaniques. En d’autres termes, les lois de la mecanique classique de Newton ont la meme forme

dans tous les systemes d’inertie (principe de relativite classique).

D’autre part, des la fin du XIX eme siecle, il devint clair que ce principe de relativite classique

ne semblait pas s’etendre aux phenomenes electromagnetiques et optiques, puisque les equations

de Maxwell (1831-1879), etablies en 1865, qui regissent ces phenomenes ne sont pas invariantes

par rapport aux transformations de Galilee, ou du moins ne seraient invariantes par rapport a ces

transformations des variables d’espace et de temps, que si l’on admettait pour le champ electromagneti-

que et pour les densites de charge et de courant des lois de transformation extremement com-

pliquees et inelegantes. En d’autres termes, il devint clair, et le premier a l’apercevoir tres distinc-

tement fut sans doute Poincare, qu’il existe une antipathie profonde entre les equations de Maxwell

et la transformation de Galilee.

Au cours du XIX eme siecle, cette antinomie etait resolue de facon plus ou moins explicite

en acceptant sans reserve la transformation de Galilee, et en admettant par consequent que les

lois de l’electromagnetisme n’avaient pas la meme forme dans tous les systemes d’inertie. Ainsi,

les equations de Maxwell n’etaient regardees comme rigoureusement valables que par rapport a un

certain systeme d’inertie privilegie que l’on supposait defini par l’ether, ce tres hypothetique milieu

materiel devant servir de support a la propagation des ondes electromagnetiques. C’est dans cet

esprit essentiellement mecaniste que toutes les experiences optiques et electromagnetiques etaient

alors interpretees, ce qui, dans la plupart des cas, donnait lieu soit a de tres reelles difficultes,

soit a la necessite de faire des hypotheses toujours tres artificielles sur les proprietes cinematiques

de l’ether : etait-il entraıne par la Terre, ou bien par les corps en mouvement, ou partiellement

entraıne ? etc.

En fait, la situation n’est pas simple et il ne peut etre question de discuter ici ces nombreuses

experiences dont l’etude releve d’un cours de physique generale (cf. E. Taylor et J.A. Wheeler,

1992, dans le livre SpaceTime Physics : introduction to special relativity, W.H. Freeman and Com-

pany, New York).

Mentionnons que dans certains cas, ces explications classiques paraissaient satisfaisantes : c’est

ce qui se passe pour le phenomene d’aberration decouvert par l’astronome Bradley en 1725 et

137

pour l’effet Doppler decouvert par Doppler en 1842. Dans d’autres cas, l’interpretation classique

est possible mais ne semble pas tres naturelle, car elle repose sur un certain degre d’entraınement

de l’ether par les corps en mouvement : c’est ce qui se passe par exemple dans l’experience de

Fizeau de 1851, dont nous dirons quelques mots plus loin. Enfin, dans le cas de l’experience de

Michelson-Morley, les difficultes d’interpretation furent beaucoup plus considerables. Le but de

cette experience, realisee par Michelson en 1881, puis par Michelson et Morley en 1887, etait de

mesurer la vitesse de l’ether par rapport a la Terre a l’aide d’un interferometre. Cette experience

decisive est decrite dans la section 3.2.

Le resultat remarquable obtenu par Michelson et Morley fut que l’ether est immobile par

rapport a la Terre. Une telle conclusion evidemment geocentrique parut cependant difficilement

defendable, et d’ailleurs en contradiction avec la theorie de l’aberration et avec l’experience de

Fizeau, de telle sorte qu’a la fin du XIX eme siecle, il devint evident que c’etait l’interpretation

classique de l’experience en question qui devait etre mise en cause.

Une premiere tentative d’interpretation fut d’abord proposee independamment par Fitzgerald

et par Lorentz en 1893 sous la forme d’une contraction longitudinale des corps en mouvement par

rapport a l’ether, mais cette hypothese n’eut que tres peu de succes (voir section 3.2).

Finalement, ce fut a Einstein (1879-1955) que revint le merite de clarifier completement la

situation grace a son celebre travail de 1905 publie dans les “Annalen der Physik”, sous la forme

d’un article intitule “Sur l’electrodynamique des corps en mouvement” (traduit en anglais dans

l’ouvrage The principle of relativity par Einstein, Lorentz, Weyl et Minkowski, 1923, Dover, New

York). Pour la premiere fois, du moins de facon tout a fait explicite, ce sont les notions classiques

d’ether et de cinematique galileenne qui sont ici definitivement condamnees et c’est une toute nou-

velle physique qui se trouve effectivement elaboree sur la base de deux postulats fondamentaux : le

principe de l’invariance de la vitesse de la lumiere dans le vide et le principe de relativite restreinte.

1) Principe de l’invariance de la vitesse de la lumiere dans le vide

Dans le vide, la vitesse de la lumiere est une constante universelle,

c = 2, 9979× 108 m/s ,

et possede donc la meme valeur dans tous les systemes d’inertie, quels que soient les mouvements

de la source lumineuse. De plus, la lumiere se propage dans le vide de facon rectiligne et uniforme,

par rapport a tout systeme d’inertie.

2) Principe de relativite restreinte

138

Toutes les lois de la physique (mecaniques, electromagnetiques, ...) doivent avoir la meme

forme dans tous les systemes d’inertie.

Le premier de ces principes, qui peut dans un certain sens etre considere comme une consequence

du second, implique evidemment une condamnation sans appel de la transformation de Galilee,

c’est-a-dire des notions classiques d’espace et de temps. C’est cela qui, par-dessus certaines polemi-

ques, doit etre regarde comme l’apport le plus important d’Einstein a la physique relativiste, car,

s’il est vrai de dire que les idees relativistes etaient dans l’air des la fin du XIX eme siecle et plus

particulierement dans les travaux de Lorentz (1853-1928) et de Poincare (1854-1912), il n’en reste

pas moins que ce fut bien Einstein qui par son article de 1905 fut le premier a comprendre de facon

tout a fait nette la necessite de rompre brutalement avec les vieilles idees relatives aux proprietes de

l’espace et du temps, comme en temoigne son principe de l’invariance de la vitesse de la lumiere

dans le vide, qu’il fut le premier et le seul a oser proposer. Il serait neanmoins injuste de ne pas

rappeler de nouveau les travaux de Lorentz relatifs a la structure des equations de Maxwell et peut-

etre plus encore ceux ou Poincare insiste sur l’antinomie existant entre la mecanique classique et

l’electromagnetisme et sur l’interet qu’il pourrait y avoir a creer une nouvelle mecanique qui serait

en harmonie avec l’electromagnetisme, de telle sorte que le principe de relativite soit applicable a

tous les phenomenes physiques et non plus seulement aux phenomenes mecaniques.

En 1955, Einstein ecrivait d’ailleurs, quelques mois avant sa mort :

”There is no doubt, that the special theory of relativity, if we regard its devopment in retrospect,

was ripe for development in 1905. Lorentz had already observed that for the analysis of Maxwell’s

equations the transformations which later were known by his name are essential, and Poincare had

even penetrated deeper in these connections. Concerning myself, I knew only Lorentz’s important

work of 1895 (”La theorie electromagetique de Maxwell” and ”Versuch einer Theorie der elektri-

schen und optischen Erscheinungen in bewegten Korpen”) but not Lorentz’s later work, nor the

consecutive investigations by Poincare. In this sense, my work of 1905 was independent. The new

feature of it was the realization of the fact that the bearing of the Lorentz-transformations trans-

cended their connection with Maxwell’s equations and was concerned with the nature of space and

time in general. A further new result was that the ”Lorentz invariance” is a general condition for

any physical theory. This was for me of particular importance because I had already previously

found that Maxwell’s theory did not account for the micro-structure of radiation and could there-

fore have no general validity”.

139

3.2 Experience de Michelson-Morley et determination intuitive de la trans-formation de Lorentz

La description de l’experience de Michelson-Morley ainsi que la determination intuitive de la

transformation de Lorentz seront effectuees dans le cadre des seances de travaux pratiques.

140

3.3 La transformation de Lorentz : approche standard

La relativite restreinte ne considere que des systemes de reference d’inertie rigoureusement

equivalents, quels que soient les phenomenes physiques consideres : soit le systeme de Copernic,

qui ne doit donc en aucune maniere etre regarde comme un systeme d’inertie privilegie, soit tout

systeme anime d’un mouvement de translation rectiligne et uniforme par rapport a lui ; c’est dans

ce sens qu’il faut comprendre le mot “restreinte”.

Un systeme d’inertie est encore considere comme etant une structure rigide pourvue d’horloges

identiques et synchronisees et le mouvement rectiligne et uniforme est naturellement defini comme

en physique classique. Ce qui est nouveau cependant, c’est la maniere dont on effectue la synchro-

nisation des horloges d’un meme systeme d’inertie, en utilisant des signaux lumineux (principe

de l’invariance de c) et non plus des regles supposees rigides ; ce qui est egalement nouveau, et

fondamental, c’est l’abandon du principe classique de synchronisation des horloges mobiles avec

celles au repos.

Considerons deux systemes d’inertie et choisissons les axes comme il est indique sur la figure

3.2. Toutes les horloges de S sont synchronisees entre elles et il en est de meme pour les horloges

FIGURE 3.2 –

de S. Nous pouvons egalement supposer que lorsque l’horloge de S qui est situee en O “coıncide”

avec l’horloge de S situee en O, ces deux horloges indiquent toutes les deux le temps 0. Bien

entendu nous ne supposons pas que l’horloge O indique toujours le meme temps que l’horloge de S

avec laquelle elle coıncide. Comme nous le verrons plus loin, il resulte du principe de l’invariance

de c que ceci est justement impossible : en d’autres termes, le principe de l’invariance de c entraıne

que la synchronisation des horloges mobiles est impossible (cf. plus loin la dilatation du temps).

Soit alors un evenement quelconque, c’est-a-dire quelque chose qui est parfaitement localise

dans l’espace et dans le temps, par exemple la collision entre deux particules ponctuelles, et soient

141

x, y, z, t et x, y, z et t les coordonnees d’espace et de temps de cet evenement dans les deux

systemes d’axes et d’horloges consideres.

Notre but est de rechercher les relations qui existent entre x, y, z, t et x, y, z, t en partant

du principe de l’invariance de c et du fait que la transformation de Galilee doit etre d’une certaine

maniere une forme approchee de ces relations. En d’autres termes, il faut modifier la transformation

de Galilee, mais aussi peu que possible, afin que la nouvelle transformation soit en accord avec le

principe d’invariance de c.

On a tout d’abord

y = y

z = z

puisque les plans x z et x z, d’une part, et x y et x y, d’autre part, sont identiques.

D’autre part, par analogie avec la transformation de Galilee, nous supposerons que x et t sont

des fonctions lineaires 2 de x et de t, c’est-a-dire que l’on a 3

x = ax+ bt

t = fx+ gt

ou a, b, f et g designent quatre constantes a determiner 4.

Montrons maintenant que ces quatre constantes sont parfaitement determinees par le principe

de l’invariance de c.

Considerons tout d’abord l’ensemble des evenements localises en O, c’est-a-dire le mouvement

ou l’histoire de O. Pour ces evenements :

x = y = z = 0 ,

2. Le caractere lineaire de la transformation en question entraıne evidemment l’invariance du mouvement rectiligne

et uniforme, c’est-a-dire que si une particule est animee par rapport a S d’un mouvement rectiligne et uniforme (x,

y, z fonctions lineaires de t), alors cette particule est egalement animee par rapport a S d’un mouvement rectiligne et

uniforme, puisqu’en vertu de la transformation lineaire en cause, x, y, z sont alors des fonctions lineaires de t. Bien

entendu, ces mouvements sont caracterises par des vitesses en general differentes ; mais dans le cas ou la particule est

un photon, ces deux vitesses sont egales en module. En d’autres termes, la linearite postulee ici entraıne l’invariance

du mouvement rectiligne et uniforme, tout comme en mecanique classique et est donc en particulier compatible avec

le principe selon lequel la lumiere (photons) se propage dans le vide selon des mouvements rectilignes et uniformes,

quel que soit le systeme d’inertie considere.3. Ces relations sont homogenes a cause de nos hypotheses sur le choix des axes et des horloges. Il suffit pour le

voir de considerer l’evenement “coıncidence de O et de O”.4. Constantes qui sont donc les memes pour tous les evenements, mais qui dependent evidemment de la vitesse

relative V des deux systemes consideres.

142

et par suite :

x = b t

t = g t

ou encore

x =b

gt .

On a donc, d’apres la definition de V ,b

g= V

Considerons ensuite le mouvement d’une particule quelconque, c’est-a-dire la succession conti-

nue des evenements qui constituent l’histoire de la particule. Portons notre attention sur deux de

ces evenements, supposes infiniment voisins :

E : x, y, z, t ; x, y, z, t

E ′ : x+ ∆x, etc. ; x+ ∆x, etc.

On a naturellement 5

~v = lim

(∆x

∆t,∆y

∆t,∆z

∆t

)et

~v = lim

(∆x

∆t,∆y

∆t,∆z

∆t

)lorsque E ′ tend vers E.

Si nous ecrivons les relations generales :

x = ax+ bt

y = y

z = z

t = fx+ gt

pour l’evenement E et pour l’evenement E ′ et si nous soustrayons membre a membre, nous obte-

nons evidemment∆x = a∆x+ b∆t

∆y = ∆y

∆z = ∆z

∆t = f∆x+ g∆t

5. On remarquera que ~v et ~v sont les vitesses de la particule au meme evenement E.

143

a cause du caractere lineaire des relations en cause. Des lors, il vient :

∆x

∆t=a

∆x

∆t+ b

f∆x

∆t+ g

∆y

∆t=

∆y

∆t

f∆x

∆t+ g

∆z

∆t=

∆z

∆t

f∆x

∆t+ g

En passant a la limite, on obtient donc les relations :

vx =avx + b

f vx + g

vy =vy

fvx + g

vz =vz

fvx + g

qui constituent la loi relativiste de composition des vitesses 6.

Elevant ces trois equations au carre et additionnant :

v2 =v2 + (a2 − 1)v2

x + 2abvx + b2

(fvx + g)2.

Dans le cas d’un photon (quantum de lumiere) se propageant dans le vide, cette relation devient :

c2 =c2 + (a2 − 1)v2

x + 2abvx + b2

(fvx + g)2.

en vertu du principe de l’invariance de c. Cette derniere equation s’ecrit encore :

(a2 − 1)v2x + 2abvx + b2 + c2 = c2(f 2v2

x + 2fgvx + g2)

et doit etre identiquement satisfaite quel que soit vx puisque la direction de ~v est tout a fait arbi-

traire 7 .

6. Sous forme vectorielle :

~v =~v + [(a− 1) ~v·

~VV + b]

~VV

f ~v·~VV + g

.7. −c ≤ vx ≤ c

144

On a donc :a2 − 1 = c2f 2

ab = c2fg

b2 + c2 = c2g2.

Reciproquement, ces dernieres relations entraınent le principe de l’invariance de c, en ce sens

que v = c entraıne alors bien v = c.

En resume, la transformation :x = ax+ bt

y = y

z = z

t = fx+ gt

entraıne une loi de composition des vitesses qui est compatible avec le principe d’invariance de c

si et uniquement si les quatre constantes a, b, f et g obeissent aux relations :

a2 − 1 = c2f 2

ab = c2fg

b2 + c2 = c2g2.

Compte tenu deb

g= V

et de la condition naturelle :

limV→0

(a b

f g

)=

(1 0

0 1

)qui permet de determiner les signes univoquement, ces trois conditions donnent pour a, b, f et g la

solution unique :

a =1√

1− V 2

c2

, b =V√

1− V 2

c2

,

f =Vc2√

1− V 2

c2

, g =1√

1− V 2

c2

.

Cette solution implique que V doit toujours etre inferieur a c, en accord avec l’idee relativiste

selon laquelle c est une vitesse limite, qu’aucun corps materiel ne saurait atteindre, ni bien entendu

depasser.

145

En definitive, la transformation qui se substitue a la transformation de Galilee et qui porte le

nom de transformation de Lorentz est 8

x =x+ V t√1− V 2

c2

y = y

z = z

t =Vc2x+ t√

1− V 2

c2

(3.6)

On remarquera qu’elle depend de c et qu’elle tend vers la transformation de Galilee lorsqu’on y

fait formellement tendre c vers l’infini.

La transformation de Lorentz etait en fait connue depuis plusieurs annees lorsqu’Einstein la

redecouvrit en 1905 a partir de son principe de l’invariance de c, en suivant une demonstration qui

est essentiellement celle donnee ci-dessus. En 1877, Voigt utilise deja la transformation de Lorentz

dans la theorie elastique de la lumiere, en constatant que cette transformation laisse l’equation de

d’Alembert :∂2ψ

∂x2+∂2ψ

∂y2+∂2ψ

∂z2− 1

c2

∂2ψ

∂t2= 0

invariante (en forme) si ψ est lui-meme invariant (en nombre). En 1899, Lorentz decouvre que

les equations de Maxwell sont egalement invariantes (en forme) par rapport a cette meme trans-

formation, si on admet que le champ electromagnetique et les densites de charge et de courant se

transforment selon certaines lois appropriees. La transformation de Lorentz fut egalement utilisee

par la suite par Larmor et Poincare, mais toujours comme un simple outil mathematique, sans si-

gnification physique vraiment fondamentale 9. Lorentz employait par exemple la transformation de

Galilee et la transformation de Lorentz simultanement et distinguait soigneusement les variables

8. Sous forme vectorielle, on a, avec ~r = ~OP et ~r = ~PO,

~r = ~r +

(1−

√1− V 2

c2

)~V · ~rV 2

+ t√1− V 2

c2

~V

t =

~V · ~rc2

+ t√1− V 2

c2

Cette forme a naturellement l’avantage de ne plus dependre de l’hypothese faite ci-dessus sur le choix des axes.9. La transformation etudiee par Lorentz en 1899 n’etait en fait que la transformation de Lorentz ecrite au premier

ordre enV

c. Les termes du second ordre furent obtenus par Larmor en 1900 et la transformation de Lorentz exacte par

Lorentz en 1903

146

d’espace et de temps figurant dans ces deux transformations : “coordonnees et temps physiques”

et “coordonnees et temps locaux”, respectivement.

Ce n’est qu’en 1905, avec Einstein, que la transformation de Lorentz prit toute son importance,

puisqu’il devint clair alors que cette transformation etait en realite la veritable transformation phy-

sique reliant les observations d’espace et de temps effectuees dans differents systemes d’inertie

sur un meme evenement quelconque. En d’autres termes, que la transformation de Lorentz devait

prendre la place de la transformation de Galilee et s’etendre ainsi a toute la physique.

L’inverse de la transformation de Lorentz s’obtient simplement en barrant et debarrant et en

changeant le signe de V . (On justifie aisement ce resultat en considerant le mouvement de O et en

remarquant que la vitesse de S par rapport a S est −~V ). On a alors :

x =x− V t√

1− V 2

c2

y = y

z = z

t =t− V

c2x√

1− V 2

c2

(3.7)

Les transformations de Lorentz considerees jusqu’ici sont dites speciales, puisqu’elles ont ete

obtenues en faisant certaines hypotheses (non essentielles) sur les axes et sur les horloges. On

obtient la transformation generale de Lorentz en combinant cette transformation speciale avec une

rotation et une translation des axes et avec une translation du temps. Si on se rappelle la forme

vectorielle donnee en bas de la page 146, il est clair que la transformation de Lorentz generale peut

s’ecrire sous la forme vectorielle suivante :

~r = ~r +

[(γ − 1)

~V · ~rV 2

+ γt

]~V + ~a

t = γ

(~V · ~rc2

+ t

)+ b

(3.8)

ou encore, en projetant l’equation vectorielle sur les axes xi :

xi = Aij

[xj +

[(γ − 1)

VkxkV 2

+ γt

]Vj + aj

]

t = γ

[Vkxkc2

+ t

]+ b

(3.9)

147

avec :

γ =1√

1− V 2/c2(3.10)

Si on fait tendre c vers l’infini dans (3.8) et (3.9), on retrouve evidemment la transformation de

Galilee generale sous forme vectorielle (3.2) et projetee sur les axes xi (3.3), respectivement.

Les transformations de Lorentz speciales forment un groupe a un parametre (V ) tandis que les

transformations de Lorentz generales forment un groupe a dix parametres : Aij (3), Vi (3), ai (3), b

(1).

En fait, la loi de composition du groupe de Lorentz, dans le cas des transformations speciales

aussi bien que generales, n’est plus la loi galileenne d’addition des vitesses, mais bien la loi rela-

tiviste de composition des vitesses qui, dans le cas general, compte tenu du resultat obtenu au bas

de la page 144 et des valeurs des quatre constantes a, b, f et g trouvees precedemment, s’ecrit :

~v =

√1− V 2

c2~v +

[1 +

(1−

√1− V 2

c2

)~V ·~vV 2

]~V

1 +~V ·~vc2

(3.11)

Cette expression se reduit bien a la loi de composition classique c’est-a-dire (3.4) si on y fait tendre

formellement c vers l’infini, c’est-a-dire en pratique si V et v sont beaucoup plus petits que c. On

remarquera encore que l’on a bien : ~v = ~v si ~V = 0, et ~v = ~V si ~v = 0.

De plus, on a

v2 − c2 =1− V 2

c2(1 +

~V ·~vc2

)2 (v2 − c2)

de sorte que v = c entraıne bien v = c, et v < c, v < c.

Lorsque tous les mouvements s’effectuent dans la meme direction, la loi de composition rela-

tiviste des vitesses se simplifie comme suit :

v =v + V

1 + vVc2

(3.12)

Il est d’ailleurs possible de demontrer directement cette relation a partir de la transformation de

Lorentz speciale (3.6) et des definitions de ~v et ~v.

En 1851, Fizeau realisa une experience interferometrique destinee a mesurer la vitesse par

rapport a la Terre d’un faisceau lumineux se propageant dans un liquide, lui-meme en mouvement

par rapport a la Terre. Le dessin 3.3 rappelle schematiquement le principe de cette experience. Si v

designe la vitesse du faisceau considere par rapport a la Terre et v sa vitesse par rapport au liquide,

et puisque tous les mouvements s’effectuent ici selon la meme direction, la loi de composition des

148

FIGURE 3.3 –

vitesses relativistes (3.12) nous permet d’ecrire 10

v =c

n(1 +

nV

c)(1 +

V

nc)−1

compte tenu de

v =c

n

ou n designe l’indice de refraction du liquide considere. Ou encore, approximativement, puisque

n est de l’ordre de l’unite et V/c beaucoup plus petit que l’unite :

v =c

n+ (1− 1

n2)V

qui est exactement la loi experimentale obtenue par Fizeau. Bien entendu, en 1851, l’interpretation

de cette loi experimentale s’effectuait en recourant a la loi de composition galileenne des vitesses

et a la notion d’ether : il en resultait que l’ether, a l’interieur du liquide, etait entraıne par le liquide

mais seulement de facon partielle, puisque sa vitesse par rapport a la Terre semblait etre 11

(1− 1

n2)V

et sa vitesse par rapport au liquide

− Vn2

L’image classique etait donc la suivante (cf. Figure 3.4) :

Vitesse de la lumiere par rapport a l’ether : c/n

10. v et v sont inferieurs a c, mais naturellement de l’ordre de c.11. c

n etait alors la vitesse de la lumiere par rapport a l’ether et non pas par rapport au liquide, comme c’est

reellement le cas.

149

FIGURE 3.4 –

Vitesse de l’ether par rapport au liquide : −V/n2

Vitesse du liquide par rapport a la Terre : V

Vitesse de la lumiere par rapport a la Terre (cinematique classique) : c/n− V/n2 + V

Bien entendu, l’image relativiste est considerablement plus simple (cf. Figure 3.5).

FIGURE 3.5 –

Vitesse de la lumiere par rapport au liquide : c/n

Vitesse du liquide par rapport a la Terre : V

Vitesse de la lumiere par rapport a la Terre (cinematique relativiste) :cn

+ V

1 + Vnc

' c

n+ (1− 1

n2)V

Mais cette simplicite n’a pu etre obtenue que par un bouleversement profond des idees clas-

siques d’espace et de temps et par l’abandon de la notion d’ether, conformement au principe de la

150

relativite restreinte. 12

Quant a la loi de composition des accelerations, elle s’obtient sans difficulte en derivant la

loi de composition des vitesses (3.11) par rapport a t et en utilisant l’expression de t donnee par

le seconde relation (3.8). La relation ainsi obtenue est relativement compliquee et, bien entendu,

differente de la loi de composition classique (3.5) ~γ = ~γ, c’est-a-dire que l’on a, en general, en

relativite

~γ 6= ~γ

ce qui implique, en vertu du principe de relativite restreinte, une condamnation capitale de la

mecanique newtonienne. Ainsi, pour le cas de la transformation speciale de Lorentz, on peut

aisement calculer l’expression de l’acceleration γ en fonction de γ

γ =dv

dt, γ =

dv

dt=dv/dt

dt/dt

En nous servant des relations de transformation speciale inverses de celles donnees en (3.7) et

(3.12), nous trouvons successivement

dv

dt=

dvdt

(1− vVc2

) + (v − V )dvdtVc2

(1− vVc2

)2

dv

dt= γ

1− V 2

c2

(1− vVc2

)2

dt

dt=

1− vVc2√

(1− V 2

c2)

et donc, finalement,

γ = γ(

√1− V 2

c2

1− vVc2

)3

confirmant qu’en general γ 6= γ. A partir de la relation precedente etablie pour le cas d’une

transformation de Lorentz speciale, on remarque que γ = 0 implique γ = 0, et vice-versa. On

peut aussi montrer pour le cas des transformations de Lorentz generales que si ~γ = 0, on a encore

~γ = 0, conformement a l’invariance du mouvement rectiligne et uniforme.

Ainsi donc, en relativite restreinte – tout comme en mecanique newtonienne – une particule

depourvue d’acceleration dans un referentiel d’inertie possede la meme propriete dans tous les

referentiels d’inertie. De facon semblable, une particule acceleree dans un referentiel d’inertie le

reste dans tous les referentiels d’inertie, bien qu’en relativite restreinte, la valeur de l’acceleration

12. En physique prerelativiste, l’ether etait non seulement, comme on l’a souvent dit, le sujet du verbe onduler,

en parlant de la lumiere ou de toute onde electromagnetique, mais c’etait aussi un systeme d’inertie privilegie et

inevitable. L’interpretation classique de la formule de Fizeau exige par exemple que l’on fasse appel a lui.

151

soit differente d’un systeme de reference d’inertie a l’autre. Ainsi donc, en relativite restreinte,

l’acceleration continue de posseder un certain caractere absolu.

Ce ne sera qu’en relativite generale, que l’acceleration perdra a son tour ce caractere absolu.

En effet, en relativite generale, il n’existe pas de systemes de reference privilegies, qu’ils soient

d’inertie ou acceleres : tous les systemes de reference y sont par principe equivalents.

152

3.4 Dilatation du temps et contraction des longueurs

a. La dilatation du temps

Considerons la situation decrite sur la figure 3.6 ou les deux horloges de S sont evidemment

synchronisees. Soient E1 la coıncidence de l’horloge H avec H1 et E2 la coıncidence de H avec

H2.

FIGURE 3.6 –

En vertu de la transformation de Lorentz speciale (3.6), on a pour tout evenement :

x =x+ V t√1− V 2

c2

, t =Vc2x+ t√

1− V 2

c2

Ecrivant ces relations pour E2 et pour E1, et soustrayant, il vient, avec des notations evidentes,

∆x =∆x+ V∆t√

1− V 2

c2

, ∆t =Vc2

∆x+ ∆t√1− V 2

c2

Or, les deux evenements consideres sont colocaux dans S :

∆x = 0

Des lors :

∆x =V∆t√1− V 2

c2

, ∆t =∆t√

1− V 2

c2

153

La relation

∆t =∆t√

1− V 2

c2

(3.13)

exprime le phenomene de dilatation du temps :

∆t > ∆t

Imaginons en effet un phenomene physique localise dans S au voisinage de H et supposons que

ce phenomene commence en E1 et finisse en E2. ∆t est la duree propre de ce phenomene et ∆t

la duree de ce meme phenomene telle qu’elle apparaıt a l’observateur S. La dilatation du temps

resulte de ce que l’on a :

duree relative > duree propre

dans le rapport 1/

√1− V 2

c2.

Ce phenomene de dilatation du temps implique evidemment que la synchronisation des hor-

loges mobiles n’est pas possible en relativite restreinte, comme le montre l’exemple ci-dessous (cf.

Figure 3.7) :

FIGURE 3.7 –

Une application bien connue de ce phenomene de la dilatation du temps est relative a l’observa-

tion au niveau du sol de certaines particules instables produites par le rayonnement cosmique a une

154

altitude d’environ 10 km. C’est le cas par exemple pour le muon µ qui possede une vie moyenne

propre :

∆t = 2× 10−6s

ainsi qu’il resulte de mesures de laboratoire. Mais les muons µ, crees au sommet de l’atmosphere

par le rayonnement cosmique, possedent par rapport a la Terre S des vitesses presque egales a c.

Par exemple :V

c= 0, 99995 ,

√1− V 2

c2= 10−2 .

La duree de vie apparente de ces muons est donc :

∆t =∆t√

1− V 2

c2

= 2× 10−4s

par rapport a la Terre.

Entre leur creation au sommet de l’atmosphere et leur desintegration, ces muons peuvent donc

parcourir par rapport a la Terre une distance egale a :

∆x = V∆t = 60 km

conformement a l’observation. Si on ne tenait pas compte de la dilatation du temps, on obtiendrait

600 m au lieu de 60 km, et on ne pourrait pas comprendre que les muons, crees a 10 km d’altitude,

soient observes au niveau du sol.

b. La contraction des longueurs

Une regle rigide AB fixe dans S est en mouvement de translation rectiligne uniforme et lon-

gitudinal par rapport a S (voir Figure 3.8). La longueur propre de la regle, l, est la distance AB

mesuree dans S, par exemple a l’aide d’une horloge et d’une source lumineuse placees en A et

d’un miroir place en B. D’autre part, il est egalement possible de definir la longueur l de la regle

relativement a S en procedant comme suit. Considerons le long de l’axe x une infinite d’horloges

fixes dans S et naturellement synchronisees.

En un meme instant t, quelconque mais fixe a l’avance, une de ces horloges, soit A, voit A en

face d’elle et de meme, en ce meme instant t, une autre horloge, soit B, voit B en face d’elle. La

longueur de la regle relativement a S, l, est alors par definition la distance mesuree dans S entre A

et B qui sont deux points fixes de S. Il est clair qu’il n’y a aucune raison pour que l et l soient a

priori egales. Pour trouver la relation entre l et l, considerons l’evenement E1 “coıncidence de A

155

FIGURE 3.8 –

et de A” et l’evenement E2 “coıncidence de B et de B”. On a :

∆x =∆x+ V∆t√

1− V 2c2

, ∆t =Vc2

∆x+ ∆t√1− V 2

c2

et aussi ∆t = 0.

Par consequent :

∆x =

√1− V 2

c2∆x (3.14)

c’est-a-dire :

l =

√1− V 2

c2l. (3.15)

On peut donc dire que pour S, la regle semble plus courte qu’elle est en realite, puisque

longueur relative < longueur propre

dans le rapport de

√1− V 2

c2a 1.

Ce phenomene de contraction des longueurs n’implique evidemment pas une modification in-

trinseque de la regle 13. Il resulte du fait que la longueur propre et la longueur relative sont definies

selon des processus operationnels tout a fait differents, qui conduisent a des resultats de mesures

differents, en vertu de la transformation de Lorentz. Ceci ne signifie nullement que la contraction

des longueurs et la dilatation du temps soient des phenomenes que nous devions regarder comme

evidents. Ils sont au contraire l’expression des proprietes relativistes de l’espace et du temps, c’est-

a-dire des regles rigides, des horloges et de la lumiere, et ces proprietes bien qu’elles ne soient

nullement illogiques ou absurdes, heurtent neanmoins fortement notre intuition, formee au contact

13. Contrairement a la contraction postulee par Lorentz et Fitzgerald en 1893, qui resultait d’une certaine interaction

physique entre les molecules de la regle et les ”molecules de l’ether”, cf. section 3.2.

156

d’une experience rudimentaire dans laquelle les vitesses V sont toujours beaucoup plus petites que

c, de sorte que le facteur de dilatation et de contraction est en pratique indiscernable de l’unite.

Revenons en a l’application interessante des muons µ observes au niveau du sol (cf. section

3.3.a). En effet, un observateur lie a un muon admettra que le temps de vie du muon est egal a

∆t = 2 × 10−6s. Pour lui, la Terre se rapproche avec une vitesse pratiquement egale a c. On ne

comprend pas a priori comment le muon pourra parcourir plus de 600m. Toutefois, en accord avec

la contraction des longueurs discutee ci-avant, la hauteur de l’atmosphere terrestre se contracte

pour lui. Si l’observateur terrestre estime que la distance (propre) a parcourir est l = 60km, elle

se reduit pour le muon a l =√

(1− (v/c)2l ' 600m. Le temps ∆t = 2 × 10−6s lui suffit donc

pour atteindre la surface de la Terre, puisque celle-ci se rapproche de lui avec une vitesse proche

de celle de la lumiere (c), de telle maniere que c∆t = 600m.

157

3.5 L’espace-temps de Minkowski et la distance spatio-temporelle

On doit a Minkowski une geometrisation de la relativite restreinte qui est de la plus grande

importance du point de vue de la visualisation et de la geometrisation de la theorie (relativite

generale, theories unifiees des diverses interactions physiques, ...).

Il s’agit en fait d’utiliser un langage geometrique fonde sur l’image d’un espace abstrait a

quatre dimensions, que l’on appelle espace-temps, dont les points representent les evenements. En

d’autres termes, un evenement est represente par un point de l’espace-temps et l’espace-temps est

regarde comme etant l’ensemble des evenements. D’autre part, un observateur S (c’est-a-dire un

systeme d’axes et un systeme d’horloges synchronisees attaches a un systeme d’inertie) caracterise

un evenement quelconque a l’aide des coordonnees d’espace et de temps :

xα = (ct, x, y, z) (3.16)

Ces quatre nombres 14 peuvent donc etre consideres comme etant les coordonnees du point-evenement

en question dans un systeme de coordonnees bien determine de l’espace-temps, dit de Minkowski.

Ainsi, si l’espace-temps de Minkowski est designe par E4, nous avons les relations :Evenement : point de E4

Observateur : systeme de coordonnees de E4

qui correspondent simplement a l’idee physique selon laquelle l’evenement est absolu 15, tandis

que ses coordonnees sont relatives a un observateur donne.

Nous avons introduit dans (3.16) pour la premiere fois la notation indicielle propre au calcul

tensoriel (qui sera aussi utilisee dans l’etude des espaces plats en coordonnees curvilignes et des

espaces riemanniens (courbes) propres a la relativite generale) : l’indice α – ainsi d’ailleurs que

tout indice grec – prendra les valeurs (0, 1, 2, 3), l’indice ”0” etant conventionnellement associe a

la coordonnee temporelle (x0 = ct), les indices i = 1, 2, 3 correspondant aux coordonnees spatiales

xi (x1 = x, x2 = y, x3 = z). On notera aussi la position superieure (dite contravariante) de l’indice

α, correspondant, suivant la convention adoptee, au caractere vectoriel du quadri-vecteur position

(spatio-temporelle), dont les quatre composantes sont donnees par (3.16).

Si on considere, a present, un evenement E et deux observateurs S et S, la transformation de

Lorentz speciale qui lie les coordonnees respectives xα et xβ (cf. (3.6)) peut s’ecrire sous la forme

14. La coordonnee temporelle t a ete multipliee par la vitesse de la lumiere c afin que les quatre coordonnees

spatio-temporelles aient les memes dimensions physiques.15. Avant la theorie de la relativite, le temps etait considere comme absolu et peut donc etre imagine comme formant

une ”droite” independante de l’observateur. En revanche, l’espace, meme en physique classique, ne possede pas ce

caractere absolu puisque, par exemple, deux evenements non simultanes et colocaux pour un observateur peuvent etre

percus comme se produisant en des endroits distincts par un autre observateur.

158

compacte comme suit :

xα =3∑

β=0

∧αβxβ (3.17)

ou encore, en adoptant la convention de sommation d’Einstein, selon laquelle lorsqu’une expres-

sion contient un indice en position superieure et le meme indice en position inferieure, la som-

mation sur cet indice est sous-entendue sur toutes les valeurs possibles de cet indice (ici, l’indice

β) :

xα = Λαβx

β (3.18)

Les quantites {Λαβ} constituent une collection de 16 nombres qui forment la matrice de transfor-

mation de Lorentz (speciale) qui s’ecrit explicitement sous la forme suivante 16 (cf. (3.6)) :

Λαβ =

γ γβ 0 0

γβ γ 0 0

0 0 1 0

0 0 0 1

(3.19)

avec γ donne par (3.10) et :

β =V

c(3.20)

Dans le cas d’une transformation de Lorentz generale, definie dans la section 3.3, la relation

(3.18) peut etre generalisee et peut s’ecrire

xα = Λαβ x

β +Mα (3.21)

ou la matrice de transformation de Lorentz generale est donnee par l’expression suivante (cf.

(3.9)) :

Λαβ =

γ γ

Vjc

γAikVkc

Aij + (γ − 1)AikVkVjV 2

(3.22)

et le quadri-vecteur constant Mα par

Mα =

(b c

Aikak

)(3.23)

Considerons maintenant deux evenements, E1 et E2 et deux observateurs S et S :

E1 : xα(1), xα(1)

16. Attention a l’utilisation quelque peu ambigue du symbole β pour designer deux choses distinctes (indices et

rapport V/c) !

159

E2 : xα(2), xα(2)

Posons :∆xα = xα(2)− xα(1)

∆xα = xα(2)− xα(1)(3.24)

∆xα et ∆xα sont les composantes du 4-vecteur−−−→E1E2 dans les deux systemes d’axes consideres.

Puisque, compte tenu de (3.21) :

xα(2) = Λαβ x

β(2) +Mα

xα(1) = Λαβ x

β(1) +Mα

il vient, par soustraction

∆xα = Λαβ∆xβ (3.25)

qui n’est autre que la loi de transformation des composantes ∆xα du 4-vecteur dans l’espace de

Minkowski E4. Suivant que l’on considere une transformation de Lorentz speciale ou generale, il

y a lieu d’utiliser dans (3.25) la forme (3.19) ou (3.22) respectivement pour la matrice de Lorentz

Λαβ.

Formons a partir de (3.25) la quantite scalaire ∆s2 definie comme suit :

∆s2 = ηαβ∆xα∆xβ = ηαβΛαµΛβ

ν∆xµ∆xν (3.26)

(avec dans le second membre une quadruple sommation sur les indices α, β, µ et ν) ou ηαβ (α, β =

0, 1, 2, 3) est un symbole de Kronecker generalise, dote des proprietes suivantes :

ηoo = −1

ηoi = 0

ηio = 0

ηij = δij

(3.27)

Dans ce cas, le developpement de l’expression (3.26) de ∆s2 en termes de ∆xα donne le

resultat suivant :

∆s2 = −c2(∆t)2 + (∆x)2 + (∆y)2 + (∆z)2 (3.28)

De plus, on peut montrer que :

ηαβ Λαµ Λβ

ν ∆xµ∆xν

peut se mettre sous la forme :

−c2(∆t)2 + (∆x)2 + (∆y)2 + (∆z)2

160

aussi bien dans le cas d’une transformation de Lorentz speciale que generale.

Verifions-le dans le cas de la transformation speciale caracterisee par la matrice de Lorentz

(3.19). On a alors :

ηαβΛαµΛβ

ν∆xµ∆xν = η00Λ0

µΛ0ν∆x

µ∆xν + ηi0ΛiµΛ0

ν∆xµ∆xν

+ η0jΛ0µΛj

ν∆xµ∆xν + ηijΛ

iµΛj

ν∆xµ∆xν

= − [γ2c2(∆t)2 + 2γ2βc∆t∆x+ γ2β2(∆x)2]

+ [γ2β2c2(∆t)2 + 2γ2βc∆t∆x+ γ2(∆x)2]

+ (∆y)2 + (∆z)2

= − c2(∆t)2 + (∆x)2 + (∆y)2 + (∆z)2

Si ∆xα et ∆xα sont relies par la matrice (3.22), l’invariance du ∆s2 decoule immediatement

du calcul ci-dessus si l’on remarque que les rotations des axes spatiaux ainsi que les translations

des axes spatiaux et temporel qui differencient les transformations de Lorentz generales des trans-

formations speciales laissent invariantes separement les quantites (∆x)2 +(∆y)2 +(∆z)2 et (∆t)2.

Nous avons ainsi mis en evidence l’invariance de la quantite ∆s2 = ηαβ ∆xα∆xβ vis-a-vis

d’une transformation de Lorentz (speciale ou generale), qui se traduit explicitement sous la forme

suivante :

−c2(∆t)2 + (∆x)2 + (∆y)2 + (∆z)2 = −c2(∆t)2 + (∆x)2 + (∆y)2 + (∆z)2 (3.29)

∆s2 peut etre interprete comme le carre de la distance dans l’espace de Minkowski entre les deux

evenements consideres. Cette forme quadratique generalise l’expression habituelle de la distance

dans l’espace euclidien tridimensionnel entre deux points voisins de coordonnees cartesiennes

respectives (y, y, z) et (x+ ∆x, y + ∆y, z + ∆z) :

∆s2 = δij∆xi∆xj = (∆x)2 + (∆y)2 + (∆z)2 (3.30)

Cette distance n’est autre que la norme du vecteur tridimensionnel ∆~x de composantes (∆x,∆y,∆z).

On sait que cette norme est invariante vis-a-vis d’une translation ou dune rotation de l’espace (une

rotation d’angle θ autour de Oz par exemple, caracterisee par une matrice de transformation ortho-

gonale).

On remarquera dans l’expression (3.28) de la distance quadridimensionnelle ∆s2 dans l’es-

pace de Minkowski la presence du signe moins devant le terme associe a la coordonnee temporelle

xo = ct. Ceci n’est que le reflet du caractere pseudo-euclidien de l’espace de Minkowski (alors que

l’espace tridimensionnel habituel, cadre de la mecanique classique, est euclidien). Ainsi, l’expres-

sion (3.26) du ∆s2 peut etre interpretee comme une pseudo-norme du quadri-vecteur−−−→E1E2 dans

l’espace pseudo-euclidien de Minkowski, le “symbole de Kronecker generalise” ηαβ remplacant

161

le symbole de Kronecker δij . Du point de vue geometrique fondamental, ηαβ et δij peuvent etre

d’ailleurs consideres comme les composantes du tenseur metrique defini respectivement sur l’es-

pace de Minkowski et sur l’espace euclidien.

Puisque le ∆s2 de deux evenements ne depend que de ces deux evenements et non pas de l’ob-

servateur, il est raisonnable de classer les paires d’evenements de la facon suivante :

1) ∆s2 < 0 (intervalle ∆s temporel)Lorsque le ∆s2 de deux evenements E1 et E2 est negatif, on dit que ces deux evenements

definissent un intervalle temporel ou encore que le quadri-vecteur−−−→E1E2 est du genre ”temps”.

Il est evident que deux evenements colocaux pour un observateur definissent toujours un in-

tervalle temporel. Reciproquement, on montre que deux evenements qui definissent un intervalle

temporel sont toujours colocaux pour un (et un seul) observateur d’inertie. Considerons en effet un

systeme d’inertie S tel que :

∆s2 = |∆~r|2 − c2∆t2 < 0 (3.31)

Cherchons alors un systeme d’inertie S (c’est-a-dire une vitesse ~V ) pour que l’on ait ∆~r = 0.

C’est-a-dire, d’apres la transformation de Lorentz ecrite sous forme vectorielle (cf. (3.8)) :

∆~r +

[(γ − 1)

~V ·∆~rV 2

+ γ∆t

]~V = 0

Pour etablir la reciproque enoncee ci-dessus, il faut et il suffit de montrer que cette derniere

equation possede une solution acceptable pour ~V , c’est-a-dire telle que V < c. Or la solution

de cette equation est :

~V = −∆~r

∆t(3.32)

et son module est bien inferieur a c puisque :

V 2 =|∆~r|2

∆t2< c2

en vertu de l’hypothese ∆s2 < 0.

On peut aussi prouver que si deux evenements sont en relation temporelle (∆s2 < 0), le signe

de ∆t est invariant (c’est-a-dire invariant de l’observateur). Ceci se demontre en partant de (cf.

(3.8)) :

∆t = γ

[~V ·∆~rc2

+ ∆t

]=

∆t

γ(3.33)

En consequence, etant donne deux evenements dont le ∆s2 est negatif, il est possible de dire

que l’un est anterieur a l’autre de facon absolue, c’est-a-dire quel que soit l’observateur considere :

l’ordre temporel de ces evenements est donc absolu.

162

D’autre part, puisqu’il existe toujours un systeme d’inertie dans lequel deux tels evenements

sont colocaux, on peut dire qu’il existe entre eux une relation causale possible, puisqu’un obser-

vateur (ou une particule) peut effectivement aller de l’un a l’autre sans depasser la vitesse limite c.

Bien entendu, deux evenements en relation causale ont un ∆s2 negatif.

2) ∆s2 = 0 (intervalle ∆s lumineux ou nul)Deux evenements dont le ∆s2 est nul definissent un intervalle lumineux. Dans ce cas, la lumiere

peut aller d’un evenement a l’autre puisqu’elle se propage dans le vide selon un mouvement recti-

ligne et uniforme de vitesse c. Reciproquement, bien sur, si la lumiere peut aller d’un evenement a

l’autre, le ∆s2 de ces evenements est nul.

Par exemple, un atome emet un photon (E1), celui-ci se propage dans le vide et est finalement

absorbe par un autre atome (E2).

3) ∆s2 > 0 (intervalle ∆s spatial)Si ∆s2 > 0, on dit que les evenements forment un intervalle spatial, ou sont en relation spatiale.

Le quadri-vecteur−−−→E1E2 est dit du ”genre espace”.

Deux evenements simultanes dans un certain systeme d’inertie sont evidemment en relation

spatiale. Reciproquement, si deux evenements ont un ∆s2 positif, il existe un systeme d’inertie (en

fait une infinite) dans lequel ces deux evenements sont simultanes.

En effet, soit S un systeme d’inertie tel que :

∆s2 = |∆~r|2 − c2∆t2 > 0

Cherchons alors un autre systeme de reference d’inertie S, defini par une vitesse ~V , tel que

l’on ait ∆t = 0. C’est-a-dire, d’apres la transformation generale de Lorentz (cf. (3.8)) :

∆t = γ

(~V ·∆~rc2

+ ∆t

)= 0

c’est-a-dire~V ·∆~rc · c∆t

= −1

On voit alors facilement que cette relation, consideree comme une equation pour ~V , possede

une infinite de solutions telle que V < c.

Enfin, il est interessant de faire remarquer que l’ordre temporel de deux evenements en relation

spatiale n’est pas absolu et, qu’en consequence, il ne peut jamais exister de relation causale entre

deux tels evenements. En effet, la transformation de Lorentz generale donne

∆t = γ

(∆t−

~V∆~r

c2

)

163

Si S est un systeme tel que ∆t = 0, on trouve que

∆t = −~V∆~r√c2 − V 2

1

c

Comme ∆~r 6= 0, on se convainc facilement qu’en faisant varier ~V , avec V < c, on peut donner

a ∆t n’importe quelle valeur (negative ou positive).

En resume, il est donc tout a fait clair que pour deux evenements E1 et E2, caracterises par

un ∆s2 > 0, aucune observation ni aucune particule ne peut aller de l’un a l’autre, de sorte qu’il

n’existe ici aucune relation causale possible entre les deux evenements en question. Enfin, le signe

de ∆t n’est pas invariant, de sorte qu’il n’existe pas non plus d’ordre temporel absolu entre ces

deux evenements. E1 sera anterieur, simultane ou posterieur a E2, selon l’observateur considere.

Le cone de lumiereEtant donne un evenement bien determineE, il est clair que ce qui precede permet de classer les

autres evenementsE ′ selon la nature de l’intervalleEE ′. Ainsi, nous avons d’abord les evenements

E ′ tels que l’intervalle EE ′ soit lumineux (c’est-a-dire les evenements E ′ a distance nulle de E).

Ces evenements E ′ sont definis par l’equation suivante, quel que soit l’observateur considere :

(x′ − x)2 + (y′ − y)2 + (z′ − z)2 − c2(t′ − t)2 = 0 (3.34)

qui represente dans E4 un cone de sommet E (voir Figure 3.9). On dit qu’il s’agit du cone de

lumiere en E : c’est l’ensemble de tous les evenements qui sont en relation lumineuse avec E.

L’interieur du cone de lumiere en E contient les evenements E ′ qui sont en relation temporelle

avec E. Il se divise evidemment en deux parties : le futur absolu de E et le passe absolu de E.

Enfin l’exterieur du cone en question contient les evenements E ′ qui sont en relation spatiale avec

E (l’ailleurs de E).

Remarquons encore que toute trajectoire corpusculaire passant parE est necessairement conte-

nue dans le cone dans le cas d’une particule materielle et est necessairement une generatrice du

cone dans le cas d’un photon. Le cone de lumiere est donc engendre par l’ensemble de toutes les

trajectoires lumineuses passant par E.

Exercices

1. A partir de la transformation de Lorentz speciale (cf. (3.6)), montrer que les relations de chan-

gement de coordonnees peuvent etre interpretees geometriquement comme un changement d’axes

obliques particulier dans un plan euclidien, suivant le graphique 3.10 (sinα = V/c) : On a en

164

FIGURE 3.9 –

effet :

x = cosαx+ sinαct

ct = sinαx+ cosαct

On remarquera que ces deux systemes d’axes ont les memes bissectrices. Pourquoi est-ce im-

portant ?

2. En vertu de la transformation de Lorentz speciale (cf. (3.6)), la loi de mouvement

x = ±ct+ Cte

entraıne

x = ±ct+ Cte′

Interpreter ce resultat.

165

FIGURE 3.10 –

3. Dessiner sur le graphique precedent le passe et le futur absolu d’un evenement quelconque.

4. Dessiner deux evenements simultanes dans S. Sont-ils en general simultanes dans S ? Comment

peut-on retrouver ce resultat a partir des relations (3.7) ? Ce resultat porte le nom de relativite de

la simultaneite.

5. Toujours en utilisant la transformation de Lorentz speciale, montrer que si deux evenements

sont simultanes pour un observateur S, leur ordre temporel est inverse selon que l’on considere un

observateur S ou un observateur ¯S situe a gauche, ou a droite de S, comme indique sur la figure

3.11.

6. Discuter la dilatation du temps a l’aide de la representation graphique de la transformation de

Lorentz speciale.

7. Enfin, discuter la contraction des longueurs a l’aide de la representation graphique de la trans-

formation speciale de Lorentz.

166

FIGURE 3.11 –

3.6 L’effet Doppler longitudinal

Supposons que O soit une source lumineuse monochromatique et que O soit un recepteur.

Imaginons egalement pour fixer les idees que la source s’eloigne du recepteur (voir Figure 3.12) :

Considerons l’emission par O d’un photon ou d’un flash lumineux en direction de O (evenement

FIGURE 3.12 –

E1) et la reception par O de ce meme flash (evenement E2).

Nous avons le tableau suivant :

S S

E1 x1 = 0 , t1 = t

E2 x2 = 0 , t2 = t

en designant par t l’instant de l’emission (a l’horloge de O) et par t l’instant de la reception (a

l’horloge de O). Notons que t et t concernent ici deux evenements differents.

En utilisant la transformation de Lorentz speciale, il est aise de completer ce tableau et d’obte-

nir :

167

S S

E1 x1 = 0 , t1 = t x1 =V t√

1− V 2

c2

, t1 =t√

1− V 2

c2

E2 x2 =−V t√1− V 2

c2

, t2 =t√

1− V 2

c2

x2 = 0 , t2 = t

Exprimant maintenant que le ∆s2 des deux evenements en question est nul, il vient 17 :

(x2 − x1)2 = c2(t2 − t1)2 (3.35)

ou encore, puisque x1 est nul et x2 negatif :

c(t2 − t1) = −x2

car on doit manifestement avoir t2 > t1. Par suite :

c

t√1− V 2

c2

− t

=V t√

1− V 2

c2

ou encore :

t =

√1 + V

c√1− V

c

t (3.36)

Telle est donc la relation entre l’instant d’emission t lu sur l’horloge de la source et l’instant

de reception t lu sur l’horloge du recepteur, dans le cas d’un flash lumineux se propageant dans le

vide.

Si la source emet une onde lumineuse monochromatique, on aura, considerant deux maxima

successifs :

∆t =

√1 + V

c√1− V

c

∆t ,

ou encore :

τ =

√1 + V

c√1− V

c

τ

17. Nous travaillons ici dans S. Si on travaille dans S, on obtient evidemment le meme resultat final. Par ailleurs, les

deux horloges considerees indiquent 0 lorsqu’elles coıncident. De plus, nous avons suppose que l’emission s’effectuait

apres cette coıncidence. t est donc positif et il en est de meme a fortiori de t.

168

en designant par τ la periode de l’onde mesuree par la source et par τ la periode mesuree par le

recepteur :

τ = ∆t , τ = ∆t

En utilisant les longueurs d’onde au lieu des periodes, cette relation peut encore s’ecrire sous la

forme suivante, puisque λ = cτ et λ = cτ ,∣∣∣∣∣∣∣λ =

√1 + V

c√1− V

c

λ

∣∣∣∣∣∣∣ (3.37)

Il s’agit la de la formule de l’effet Doppler relatif aux ondes lumineuses, ou plus generalement

aux ondes electromagnetiques se propageant dans le vide, dans le cas ou la source et le recepteur

s’eloignent l’un de l’autre :

λ > λ (red-shift) .

On definit, en astrophysique observationnelle, le red-shift z (appele en francais ”decalage vers

le rouge”) d’une galaxie ou d’un quasar, comme etant

z =∆λ

λ=λ− λλ

ou

∆λ = λ− λ

En vertu de (3.37), on a donc

z =

√1 + V

c√1− V

c

− 1

Le quasar le plus distant possede un red-shift z = 6, 28. Dans le cadre de la theorie de la rela-

tivite restreinte (i.e. ne connaissant pas encore lexistence de la theorie de la Relativite Generale),

on conclut donc que ce quasar semble s’eloigner de nous avec une vitesse egale a 96, 3% celle de

la vitesse de la lumiere.

Si la source et le recepteur se rapprochent l’un de l’autre, il est facile de voir que l’on a par

contre : ∣∣∣∣∣∣∣λ =

√1− V

c√1 + V

c

λ

∣∣∣∣∣∣∣ (3.38)

c’est-a-dire :

λ < λ (blue-shift)

169

Lorsque V est beaucoup plus petit que c, ces formules prennent la forme approchee mieux

connue :

λ =

(1± V

c

)λ

que l’on ecrit souvent sous la forme

z =∆λ

λ= ±V

c(3.39)

L’effet Doppler considere ici porte le nom d’effet Doppler longitudinal parce que l’onde lumi-

neuse se propage parallelement a la vitesse relative entre la source et le recepteur. Cet effet Doppler

longitudinal est essentiellement un effet du premier ordre, alors que l’effet Doppler transversal est

du second ordre en V/c (cf. page 182).

La formule relativiste de l’effet Doppler longitudinal :

λ =

√1± V

c√1∓ V

c

λ =

[1± V

c+

1

2

(V

c

)2

+ ...

]λ (3.40)

a ete verifiee experimentalement, jusqu’au second ordre inclus, par Ives et Stilwell en 1941.

Exercices

1. Effet Doppler longitudinalEtudier l’effet Doppler longitudinal a l’aide de la representation graphique de la transformation

de Lorentz speciale. On considere sur la trajectoire de la source dans l’espace-temps (ensemble de

tous les evenements loacalises a la source) les emissions de deux maxima successifs. Chacun de

ces maxima se propageant vers le recepteur a la vitesse de la lumiere, il est facile d’obtenir les

receptions de ces deux maxima par le recepteur. En exprimant que λ = cτ et λ = cτ ont la meme

projection sur l’une des deux bissectrices, on obtient la formule cherchee avec un peu de trigo-

nometrie.

2. Expansion superluminique du quasar 3C273

Les sources d’energie les plus puissantes que nous connaissions dans l’Univers sont associees

avec des astres d’apparence stellaire, appeles ”quasars”. Typiquement, ceux-ci sont situes a des dis-

tances de plusieurs milliards d’annees lumiere et, malgre leurs tres petites dimensions par rapport

a celles des galaxies, les quasars possedent une luminosite au moins 100 fois plus elevee que celle

de notre propre Galaxie, la Voie Lactee, composee elle-meme de plus de 100 milliards d’etoiles.

Vu leur distance cosmologique et leur tres grande luminosite, les quasars constituent des phares de

tout premier choix pour etudier le contenu materiel et la structure de l’Univers.

170

Un des problemes rencontres lors de l’etude des quasars provient du fait que certains d’entre

eux sont formes de plusieurs composantes distinctes qui semblent, notamment dans le domaine

radio, se separer les unes des autres avec des vitesses relatives superieures a la vitesse de la lumiere.

On parle alors de vitesses superluminiques (cf. figure 3.13).

FIGURE 3.13 –

Legende de la figure 3.13 : Contours representant des intensites egales d’emission radio en pro-

venance du quasar 3C273. On voit a partir de ces graphes une composante brillante (a droite) du

quasar qui s’eloigne avec une vitesse superluminique. L’epoque de chaque observation est indiquee

en annee decimale sur les differents graphes. Chaque division sur l’echelle horizontale correspond

a 2 milli-secondes d’arc (1 milli-seconde d’arc = 10−3/3600 degres = 4, 8510−9 radians). Figure

de Pearson et al., 1981, Nature, Vol. 290, pp. 365-368.

Une des theories qui permet de comprendre ces observations suppose que le quasar emet un jet

de matiere (plasma) avec une vitesse relativiste le long d’une direction proche de la ligne de visee.

Le mouvement et l’emission de lumiere des composantes formant le jet permettent de comprendre

la vitesse apparente superluminique observee.

La figure 3.14 illustre la propagation de la lumiere vers un observateur distant, emise a deux

instants differents, a partir d’une meme structure du jet qui se propage avec une vitesse v < c.

L’intervalle de temps entre les deux emissions d’un flash illustrees dans la figure 3.14 vaut ∆t. Le

temps est mesure localement, pres de la structure du quasar, au moyen d’un systeme de reference

(coordonnees et temps) attache a la Terre. Evidemment, a cause du trop grand eloignement du

quasar, nous n’avons aucune chance de pouvoir mesurer directement ∆t. La seule chose qu’il nous

171

est possible de mesurer est l’intervalle de temps ∆trec entre les moment de reception des deux

flashes sur Terre. A partir de la figure 3.14, on trouve facilement que

∆trec = ∆t · (1− v

ccos θ)

ou θ represente l’angle entre la direction du jet et celle de l’observateur.

FIGURE 3.14 –

(Legende : figure de gauche) : Emission d’un premier flash lumineux vers la Terre a partir d’une

composante brillante du quasar qui se deplace suivant une direction faisant un angle θ par rapport

a celle de l’observateur terrestre, avec une vitesse v relativiste. (Legende : Figure de droite) : La

meme structure du quasar emet un second flash lumineux apres un intervalle de temps ∆t. Figure

adaptee a partir de l’article de Gabuzda, 1987, American Journal of Physics, Vol. 55, pp. 214-215.

Un deuxieme inconvenient d’observer les structures radio d’un quasar a partir de la Terre pro-

vient du fait que nous n’en voyons qu’une projection sur le plan du ciel. Il nous est en effet im-

possible de mesurer les mouvements le long de la ligne de visee. Nous sommes donc seulement

172

capables de mesurer leur mouvement propre, c’est-a-dire la projection des mouvements vrais pro-

jetes sur le plan du ciel. L’expression de ce mouvement propre ∆xrec detecte sur un recepteur

d’images vaut tout simplement (cf. figure precedente)

∆xrec = v∆t sin θ

La vitesse apparente vrecx avec laquelle nous mesurons le deplacement de la structure du quasar

sur le recepteur vaut donc

vrecx =∆xrec

∆trec=

vc

sin θ

1− vc

cos θ

Quelle est la valeur de vrecx lorsque la structure du quasar est emise le long de la ligne de visee

vers la Terre ? Et perpendiculairement a celle-ci ?

Trouver une expression qui donne l’intervalle des angles θ pour lesquels vrecx est superieur a c.

Pour θ = 45 deg, pour quelle vitesse de v obtiendra-t-on vrecx > c ?

Etablir une seconde expression pour l’angle θmax tel que la valeur de vrecx y est maximale.

Montrer que cet angle verifie l’equation cos θmax = v/c. Montrer que pour cette valeur de θmax, la

vitesse apparente maximum de vrecx vaut

vrec,maxx

c=

v/c√1− (v/c)2

Quelle est la valeur apparente maximale de vrecx lorsque v = 0, 99c ?

Sachant que la distance du quasar 3C273 est d’environ 2,6 milliards d’annees lumiere, deduire

a partir des observations radio de 3C273 la vitesse apparente de la structure radio brillante qui se

deplace par rapport au centre de lumiere du quasar 18.

18. Des vitesses superluminiques ont ete mesurees pour les structures radio de plusieurs dizaines de quasars

differents.

173

3.7 La mecanique relativiste du point materiel

Il est evident que l’equation de Newton n’est pas invariante par rapport a la transformation

de Lorentz, a moins d’admettre pour la force ~F une loi de transformation fort peu naturelle, qui

conduirait d’ailleurs a de serieuses difficultes du point de vue de la theorie physique des forces. En

fait, il est bien clair que l’equation de Newton est en harmonie tellement etroite avec la transfor-

mation de Galilee, que l’abandon de cette derniere en relativite restreinte implique necessairement

que l’on repense completement la formulation de la mecanique, et pour commencer, la formulation

de la mecanique d’une particule.

Le probleme consiste donc a generaliser les notions de masse, d’acceleration et de force et a

postuler une equation de mouvement repondant a plusieurs exigences : cette equation doit etre une

equation vectorielle dans E4, de telle sorte que son invariance par rapport aux transformations de

Lorentz soit automatiquement satisfaite ; elle doit se reduire a l’equation de Newton si la vitesse

de la particule consideree est beaucoup plus petite que c, ou encore si c tend formellement vers

l’infini ; elle doit etre telle que la vitesse de la particule ne puisse jamais devenir egale a c, ni a

fortiori plus grande que c ; et enfin elle doit conduire au mouvement rectiligne et uniforme, qui est

bien ”Lorentz-invariant”, lorsque la force s’annule.

La solution de ce probleme s’obtient en fait par une generalisation tout a fait naturelle de

l’equation de Newton 19 :

m0d~v

dt= ~F

en y remplacant chacune des grandeurs classiques m0, t, ~v et ~F par un scalaire ou un vecteur

approprie de E4.

En ce qui concerne m0, aucune modification n’est necessaire puisqu’il s’agit d’une constante

qui est bien sur invariante. Pour des raisons qui deviendront vite evidentes, nous dirons que m0 est

la masse propre de la particule. Il s’agit d’une constante positive que l’on assigne une fois pour

toutes a la particule en question ; c’est donc une propriete intrinseque de la particule.

Considerons maintenant le temps t : il s’agit d’un scalaire de E3, mais non pas d’un scalaire de

E4 puisque t est une coordonnee de l’espace-temps.

Ainsi la derivee d’un vecteur de E4 par rapport a t n’est evidemment pas un vecteur de E4, de

sorte que l’operation :d

dt

19. La masse de la particule est ici designee par mo pour des raisons de commodite, que l’on comprendra par la

suite.

174

est ici tout a fait inadequate. Il est cependant facile de lui substituer l’operation :

d

dτ

qui ne souffre pas de cet inconvenient, en introduisant le temps propre τ de la particule consideree,

qui n’est rien d’autre en fait (a la constante c pres) que la longueur de la trajectoire de la particule

dans E4, relativement a la metrique de Minkowski :

ds2 = −c2dt2 + dx2 + dy2 + dz2 . (3.41)

Considerons la trajectoire de la particule dans E4 : c’est l’ensemble de tous les evenements qui

constituent l’histoire de la particule. Soient deux points infiniment voisins sur cette trajectoire et

leurs coordonnees

xα, xα + dxα

relativement aux axes xα = ct, x, y, z associes a un observateur d’inertie quelconque (voir

Figure 3.15).

FIGURE 3.15 –

On sait que le ds2 entre ces deux evenements, qui est defini par :

ds2 = ηαβdxαdxβ = −c2dt2 + dx2 + dy2 + dz2

est un invariant 20 negatif. En fait, on a :

ds2 = (v2 − c2)dt2 < 0

20. C’est-a-dire que ηαβdxαdxβ a la meme valeur quelles que soient les coordonnees considerees : cette grandeur

ne depend donc que des deux evenements infiniment voisins choisis sur la trajectoire de la particule.

175

ou v designe le module de la vitesse ~v :

v2 =

(dx

dt

)2

+

(dy

dt

)2

+

(dz

dt

)2

Il en resulte que la grandeur reelle :

dτ =

√1− v2

c2dt (3.42)

est egalement invariante dans E4. Cette grandeur dτ est l’intervalle de temps propre de la parti-

cule entre les deux evenements consideres. L’intervalle de temps propre de la particule entre deux

evenements quelconques E1 et E2 situes sur sa trajectoire de E4 est evidemment :

∆τ =

∫ t2

t1

√1− v2

c2dt (3.43)

v etant une fonction connue de t. Il s’agit essentiellement (a un facteur c pres) de la longueur de

l’arc E1E2 dans la geometrie pseudo-euclidienne de Minkowski (voir Figure 3.16).

FIGURE 3.16 –

Quant au temps propre de la particule, il est defini a une constante additive pres, par la primi-

tive :

τ =

∫ √1− v2

c2dt (3.44)

Si on fixe la constante de primitivation, c’est-a-dire si on choisit le point de la trajectoire a partir

duquel on compte τ , la fonction :

τ = τ(t)

est parfaitement determinee et on peut ecrire les equations de la trajectoire sous la forme pa-

rametrique 21 :

xα = xα(τ) . (3.45)

21. Dans la representation ordinaire :ct = ct

x = x(t)

y = y(t)

z = z(t)

xα = xα(t) .

176

et definir :

uα =dxα

c dτ(3.46)

qui est manifestement un vecteur de E4. Ce vecteur est naturellement tangent a la trajectoire

consideree, au point τ en question (voir Figure 3.17).

FIGURE 3.17 –

De plus 22, on a :

ηαβuαuβ = ηαβ

dxα

c dτ

dxβ

c dτ

c’est-a-dire :

ηαβuαuβ = −1 (3.47)

de telle sorte que uα est un quadri-vecteur du genre temps de longueur constante (= 1).

On dit que uα est la quadri-vitesse (unitaire) de la particule, ou encore sa vitesse dans E4.

Compte tenu de :

dτ =

√1− v2

c2dt ,

il est facile de voir que les relations qui existent entre la vitesse dans E4 :

uα =dxα

c dτ

et la vitesse dans E3 :

vi =dxi

dt

De plus, en vertu de la definition du temps propre :

τ = τ(t) , t = t(τ) .

Par suite :

xα = xα(τ) .

22.

ds2 = ηαβdxαdxβ = −c2dτ2 .

177

sont simplement :

uo =1√

1− v2

c2

, ui =vi/c√1− v2

c2

que nous ecrirons sous la forme :

uα =(1, vi/c)√

1− v2

c2

(3.48)

De ce qui precede, il resulte que la generalisation la plus simple de l’equation de Newton

consiste a considerer le vecteur de E4

m0cduα

dτ

et a l’egaler a une certaine force quadridimensionnelle Kα. Nous sommes ainsi tout naturellement

amenes a postuler l’equation de mouvement :

m0cduα

dτ= Kα (3.49)

ou Kα designe un vecteur de E4 qui represente la force reelle a laquelle la particule en ques-

tion est soumise. Bien entendu, la possibilite de representer les forces reelles par des vecteurs de

E4 doit etre examinee dans le cadre de la theorie physique des forces (dans le cas de la force

electromagnetique agissant sur une particule chargee, cette possibilite se presente d’elle-meme,

tout naturellement). On a, de plus,

ηαβKαuβ = 0 (3.50)

qui est une consequence de l’equation de mouvement, puisque le vecteur uα est de longueur

constante. On a, en effet :

ηαβKαuβ = ηαβmoc

duα

dτuβ

=m0 c

2

d

dτ(nαβu

αuβ) = 0

En resume, toute force reelle est representee en relativite restreinte a l’aide d’un vecteur Kα

de E4, identiquement orthogonal a la vitesse uα de la particule, et l’equation fondamentale de la

mecanique relativiste s’ecrit sous la forme (avec 3 equations independantes)

m0cduα

dτ= Kα , avec uα =

dxα

c dτ

Cette equation fondamentale est evidemment ”Lorentz-invariante”, puisqu’il s’agit d’une equation

vectorielle dans E4. De plus, lorsque la force s’annule on a bien un mouvement rectiligne et uni-

forme. En effet, on a alors :

uα = constante

178

c’est-a-dire :vi/c√1− v2

c2

= constante ,1√

1− v2

c2

= constante ;

ou encore :

vi = constante .

Considerons maintenant les trois dernieres equations :

m0cdui

dτ= Ki (3.51)

Elles peuvent encore se mettre sous la forme :

d

dt(mvi) = F i (3.52)

si on pose :

m =m0√

1− v2

c2

(3.53)

F i =

√1− v2

c2Ki . (3.54)

La grandeur m s’appelle la masse relative de la particule (elle est relative au systeme d’inertie

considere) : elle varie en general avec le temps puisqu’elle depend de la vitesse v. Enfin, les F i

definissent un vecteur de E3, que l’on appellera la force tridimensionnelle.

L’equationd

dt(mvi) = F i

peut naturellement s’ecrire sous la forme vectorielle dans E3 :

ddt

(m~v) = ~F (3.55)

qui rappelle tres fortement l’equation de Newton. Ici cependant, m est en general variable et ne

peut donc sortir de la derivee.

Cette derniere equation montre que l’equation de Newton est bien obtenue comme cas limite

de l’equation de mouvement relativiste lorsque v est negligeable par rapport a c. Si v n’est pas

negligeable par rapport a c, la masse relative m peut devenir par contre appreciablement plus

grande que la masse propre m0.

En fait, si v tend vers c, m tend vers l’infini, ce qui implique que la particule ne peut jamais

atteindre la vitesse c puisque son inertie grandit sans cesse au fur et a mesure que sa vitesse se

rapproche de c.

179

La grandeur

pα = m0cuα (3.56)

est l’impulsion de la particule dans E4 et la grandeur :

pi = m0cui = mvi (3.57)

son impulsion dans E3. On a donc

~p = m~v (3.58)

et bien entendu :d

dt~p = ~F . (3.59)

Considerons maintenant la premiere equation fondamentale :

m0cdu0

dτ= K0 (3.60)

que l’on sait d’ailleurs n’etre pas independante des trois autres. Elle s’ecrit encore :

d

dt(mc) =

√1− v2

c2K0 (3.61)

ou encore 23

d

dt(m c2) = ~F · ~v (3.62)

Par analogie avec l’equation classique de conservation de l’energie, nous sommes donc amenes

a definir l’energie cinetique de la particule par :

T = mc2 −m0c2 (3.63)

ce qui permet d’ecrire la relation precedente sous la forme :

dT

dt= ~F · ~v (3.64)

qui est exactement la forme classique 24.

23.

ηαβKαuβ = δijK

iuj −K0u0 = 0

d’ou :

K0 =δijK

iuj

u0=

1

c

~F · ~v√1− v2

c2

compte tenu de (3.48) et (3.54).24. Il est clair que l’equation essentielle est

m0duαdτ

= Kα

180

En vertu de la definition de l’energie cinetique T , on a evidemment

mc2 = m0c2 + T (3.65)

ce qui conduit a considerer mc2 comme etant l’energie totale de la particule, formee de deux

termes : une energie de masse propre et une energie cinetique.

D’autre part, si l’expression :

T = (m−m0) c2 =

1√1− v2

c2

− 1

m0c2

est developpee en serie des puissances dev

c, il vient :

T =1

2m0v

2

[1 +

3

4

v2

c2+ ...

](3.66)

de sorte que nous retrouvons l’expression classique en premiere approximation.

Remarquons encore pour terminer que l’on a

pα = m0cuα =

(1

cmc2,mvi

)(3.67)

ce qui justifie le nom de vecteur energie-impulsion donne a ce quadri-vecteur pα.

Une relation interessante lie l’impulsion ~p = m~v et l’energie totale mc2 ; elle s’ecrit comme

suit :

m2c4 = m20c

4 + p2c2 (3.68)

En effet, on a, vu (3.47), (3.48) et (3.56) :

ηαβpαpβ = m2

0c2 ηαβu

αuβ = −m20c

2

= −(p0)2 + δijpipj

= −m2c2 + p2

d’ou (3.68).

avec Kαuα = 0. Les formes plus conventionnelles

d(m~v)

dt= ~F

dT

dt= ~F · ~v

sont evidemment correctes, mais dans un certain sens, secondaires.

181

Considerons finalement le cas important du photon. On a toujours dans ce cas : v = c et, par

suite :

m0 = 0 (3.69)

en vertu de (3.53).

La masse propre du photon est donc nulle et la masse relative indeterminee. La determination se

fait en mecanique quantique, en recourant au dualisme onde-corpuscule et au postulat d’Einstein :

mc2 = hν (3.70)

La relation entre l’impulsion et l’energie d’un photon est donc :

p = mc =hν

c(3.71)

ou h designe la constante de Planck et ν la frequence de l’onde electromagnetique a laquelle le

photon appartient. Cette relation decoule de (3.68) adaptee au cas du photon (m0 = 0) et de (3.70).

Le quadri-vecteur energie-impulsion du photon a donc pour composantes :

pα = (hν

c,hν

cli) (3.72)

ou les li representent les composantes d’un vecteur unitaire ~l (δij lilj = 1) pointant dans la direc-

tion de propagation du photon.

3.7 Exercices

1. L’effet Doppler general

Etudier l’effet Doppler dans le cas ou le recepteur est fixe en O dans un systeme d’inertie et

ou la source lumineuse S est animee par rapport a ce systeme d’un mouvement quelconque (voir

Figure 3.18).

Considerons l’emission par S d’un flash lumineux : evenement E1, et la reception par O de ce

flash : evenement E2. Si x(t), y(t) et z(t) definissent le mouvement de S, on a

E1 : x(t1), y(t1), z(t1), t1; E2, 0, 0, 0, t2

Par suite, puisque le ∆s2 de ces deux evenements est nul :

t2 = t1 +r(t1)

c

avec ~r(t) le vecteur ayant pour composantes (x(t), y(t), z(t)).

182

FIGURE 3.18 –

Si on considere l’emission par la source monochromatique de deux maxima successifs en t1 et

t1 +dt1 et la reception de ces maxima par l’observateur en t2 et t2 +dt2, on a donc en differentiant

l’equation ci-dessus 25

dt2 = dt1 +1

c(~r · ~vr

)t1dt1

D’autrepart, l’intervalle de temps propre de la source entre les deux emissions en question est

dτ1 = (

√1− v2

c2)t1dt1

et l’intervalle de temps propre de l’observateur entre les deux receptions

dτ2 = dt2

Par suitedτ2

dτ1

=

1 + vrc√

1− v2

c2

t1

en posant

vr =~V · ~rr

= vitesse radiale de la source.

Maisdτ2

dτ1

=τ

τ0

=λ

λ0

25. dt1 est assimile a un infiniment petit.

183

D’ou la formule relativiste de l’effet Doppler

λ

λ0

=

1 + vrc√

1− v2

c2

instant d′emission

Discuter a partir de cette formule l’effet Doppler longitudinal et l’effet Doppler transversal.

184

2. Formule de l’aberration relativiste

En partant de la loi de composition des vitesses, demontrer la formule relativiste de l’aberration

(voir figure 3.19)

sin θ =

Vc− (1−

√1− V 2

c2) cosα

1− Vc

cosαsinα

qui s’ecrit encore

sin θ =V

csinα(1 +

V

2ccosα)+

FIGURE 3.19 –

~v et ~v sont les vitesses d’un photon par rapport a S et S, respectivement.

185

Chapitre 3 : La relativite restreinteĆhapitre 3 : La relativite restreinte´ 3.1 La transformation de Galilee et les difficult´ es de la physique pr´ érelativiste Considerons

Documents