Comment fonctionne un réseau de neurones ? - Rétro-propagation #2 by rerere

fr · @rerere · Jul 16 '18 (edited)

$31.62

Comment fonctionne un réseau de neurones ? - Rétro-propagation #2

<center>
![artificial-intelligence-3382514_1920(1).jpg](https://ipfs.busy.org/ipfs/QmUarhEZdbdWH9iChVPWUZwB8cQeEXzziTRheqghUrDhmL)
https://pixabay.com/en/artificial-intelligence-brain-think-3382514/
</center>

Dans le dernier article, nous avons vu comment en fonction de données que nous donnons en entrée de notre système, nous avons réussi à déterminer la catégorie d'appartenance d'un objet. Dans cet article, nous allons chercher à comprendre comment notre système peut s'améliorer. Pour cela, nous allons nous placer dans une phase d'apprentissage, c'est-à-dire que nous aurons connaissance de la réelle catégorie d'appartenance de notre objet.

Lien du précédent article : https://steemit.com/fr/@rerere/comment-fonctionne-un-reseau-de-neurones-propagation-1

<h2>Déterminer l'erreur</h2>

Dans un premier temps, nous allons propager nos valeurs dans notre système afin de pouvoir déterminer un score. À partir de ce score, nous allons le comparer à ce que nous aimerions avoir. En effet, si notre objet de départ représenté, par exemple une chaise, nous aimerions que notre système nous dise que cet objet représente une chaise et non une table. Ainsi, nous allons comparer chacun des nœuds de sortie de notre réseau. Avec cette comparaison, nous allons pouvoir obtenir une erreur. Afin de la déterminer, nous appliquons la formule suivante :

<center>
![Screenshot from 2018-07-16 09-28-49.png](https://ipfs.busy.org/ipfs/QmaFU2YeL5P8XP8geby7tWowLKbL9anGKS692p5icAZqsR)
</center>

L'erreur que nous avons en sortie est égale à la dérivée de la fonction d'activation qui prend en paramètre la somme des valeurs multipliés par la valeur correspondante. Nous allons multiplier cela par la différence entre la valeur désiré t et la valeur que nous avons obtenus avec notre réseau y.

<br />

Cette erreur, que nous avons obtenue sur la dernière couche, nous allons la rétro-propager, c'est-à-dire que nous allons chercher l'erreur des nœuds précédent à partir de celle-ci. Pour ce faire, nous appliquons la formule suivante :

<center>
![Screenshot from 2018-07-16 09-39-09.png](https://ipfs.busy.org/ipfs/QmRqRdDqkKtVnucB8eDHFAAhcpFwhEJce1N8ei4jJJbMww)
</center>
Ici, nous allons rétro-propager l'erreur en fonction de l'influence que le neurone dans la détermination de la catégorie d'appartenance. C'est pour cela que nous multiplions la valeur de l'erreur de la couche suivante par le poids correspondant. Ensuite, il ne nous reste plus qu'a le multiplier par la dérivée de la fonction d'activation qui prendre en paramètre la valeur obtenue sur le nœud.
<br />

À partir de cette erreur, nous allons pouvoir savoir la *direction* où nous devons aller afin de corriger au mieux les poids qui composent notre système.

<h2>Correction des poids</h2>

Une fois l'erreur déterminée, nous allons pouvoir, à partir de celle-ci, déterminer la nouvelle valeur du poids. Pour ce faire, nous allons appliquer la formule suivante :

<center>
![Screenshot from 2018-07-16 09-48-11.png](https://ipfs.busy.org/ipfs/QmXja9sfKPGsJ1QD8irtjtwU9xbGcnnZRV9BMh8EJX6Uoq)
</center>

Ici, nous faisons intervenir λ, qui correspond au taux d'apprentissage. Ce taux d'apprentissage est généralement très petit 0.01 voir moins. Cela va permettre de converger vers une valeur d'un poids optimal. Si nous ne faisons pas intervenir de taux d'apprentissage, la valeur va directement s'adapter à notre donnée. Cependant, nous voulons que notre système soit général. Pour imager, nous pouvons prendre le cas d'un classificateur d'animaux. Si je prends l'image d'un chien, j'aimerais que mon système détermine des caractéristiques propres au chien (museau, 4 pattes ...). En revanche, si j'ai un cas particulier d'un chien qui à, par exemple, des tâches sur son pelage, je ne veux pas que mon système prenne en compte ces tâches comme étant une caractéristique majeure. Ainsi, le taux d'apprentissage me permet de résoudre ce problème.

Une fois la nouvelle valeur du poids trouvée, il ne me reste plus qu'à l'appliquer sur mon système. L'une des possibilités que nous pouvons faire est de prendre un lot de données et d'enregistrer pour chacune de ces données le nouveau poids sans l'appliquer sur notre système. Ainsi, nous pouvons faire la moyenne de cet ensemble de poids ce qui permettra à notre système d'être général lors de l'apprentissage. De plus, afin d'avoir un système optimal, il nous faut l'entraîner sur énormément de données.

<h2>Problème de recherche</h2>

Lorsque nous cherchons la valeur du nouveau poids, nous avons parlé du taux d'apprentissage qui détermine le pas du déplacement. Ce que nous cherchons, c'est une valeur du poids dont l'erreur est la plus basse. L'un des problèmes que nous pouvons rencontrer et si on se situe dans un minimum local. Le problème est que nous voulons le minimum global et non un minimum local.

<center>
![Extrema_example_original.svg.png](https://ipfs.busy.org/ipfs/QmUzrtXxb6mpFtW5iQytzPjH8VT7FXbJ6NzPUiBKzzRwsR)

Source de l'image : commons.wikimedia.org/wiki/File:Extrema_example.svg
Illustration du problème de recherche.
</center>

Nous avons aussi des problèmes liées à une valeur du taux d'apprentissage trop petit ou trop grand. En effet, si le taux d'apprentissage et trop grand, la valeur du poids, va toujours fluctuer. En revanche, si la valeur du taux d'apprentissage est trop petite, la valeur du poids va mettre énormément de temps afin de converger.

<center>
![Screen-Shot-2018-02-24-at-11.47.09-AM.png](https://ipfs.busy.org/ipfs/QmTMFhN9FXMB8MEy4DH3wwckifqX21sufHQksepuTdFUrQ)
Source de l'image : https://www.jeremyjordan.me/nn-learning-rate/
Illustration du problème du taux d'apprentissage.
</center>

</center>

<h2>Résumé</h2>

Durant la phase d'entraînement, nous allons chercher à améliorer notre système. Pour ce faire, nous allons, dans un premier temps, propager notre donnée dans notre système. Par la suite, nous allons obtenir un score que nous allons comparer à ce que l'on aurait aimé obtenir. Une fois l'erreur obtenue, nous allons rétro-propager cette erreur sur l'ensemble de notre système. Enfin, nous allons modifier la valeur de notre poids afin de minimiser cette erreur.

<br />

Dans cet article, nous avons vu une méthode de rétro-propagation. Il en existe d'autres qui vont s'adapter en fonction du cas d'application que nous allons avoir.

<br />

Dans un prochain article, nous aborderons les réseaux de neurones à convolution. On utilise ce type de réseau dans le traitement des images. N'hésitez pas à me donner vos retours sur cet article, que ce soit des corrections à apporter, des questionnements... Merci pour votre temps de lecture.

<h2>Aller plus loin :</h2>
- https://fr.wikipedia.org/wiki/R%C3%A9tropropagation_du_gradient

👍 utopian-io, hendrikdegrote, steemstem, lafona-miner, justtryme90, tombstone, abigail-dantes, kevinwong, curie, lemouth, vact, fredrikaa, ixindamix, metmuseum, anwenbaumeister, anarchyhasnogods, evildido, howo, charitybot, lamouthe, mahdiyari, dber, kryzsec, thevenusproject, de-stem, ertwro, mountainwashere, gra, zest, kenadis, dna-replication, astrophoto.kevin, saunter, laylahsophia, carloserp-2000, derbesserwisser, nitesh9, clement.poiret, kerriknox, up-quark, fancybrothers, lianaakobian, mountain.phil28, terrylovejoy, churchboy, chloroform, flugschwein, amavi, mathowl, serylt, foundation, alexander.alexis, drmake, alexzicky, sco, massivevibration, rharphelle, the-devil, simba, stem-espanol, borislavzlatanov, adetola, joe.nobel, dexterdev, and 152 others

`post_id`	56,693,876
`author`	rerere
`permlink`	comment-fonctionne-un-reseau-de-neurones-retro-propagation
`category`	fr
`json_metadata`	{"users":["rerere"],"image":["https:\/\/ipfs.busy.org\/ipfs\/QmUarhEZdbdWH9iChVPWUZwB8cQeEXzziTRheqghUrDhmL"],"tags":["fr","science","technology","francostem","steemstem"],"app":"busy\/2.5.2","community":"busy","links":["https:\/\/pixabay.com\/en\/artificial-intelligence-brain-think-3382514\/","https:\/\/steemit.com\/fr\/@rerere\/comment-fonctionne-un-reseau-de-neurones-propagation-1","https:\/\/www.jeremyjordan.me\/nn-learning-rate\/","https:\/\/fr.wikipedia.org\/wiki\/R%C3%A9tropropagation_du_gradient"],"format":"markdown"}
`created`	2018-07-16 08:21:30
`last_update`	2018-07-16 08:22:33
`depth`	0
`children`	2
`net_rshares`	14,677,176,537,595
`last_payout`	2018-07-23 08:21:30
`cashout_time`	1969-12-31 23:59:59
`total_payout_value`	23.849 SBD
`curator_payout_value`	7.774 SBD
`pending_payout_value`	0.000 SBD
`promoted`	0.000 SBD
`body_length`	6,725
`author_reputation`	5,933,805,862,753
`root_title`	"Comment fonctionne un réseau de neurones ? - Rétro-propagation #2"
`beneficiaries`	`[]`
`max_accepted_payout`	1,000,000.000 SBD
`percent_steem_dollars`	10,000
`author_curate_reward`	""

properties (23)vote details (216)

voter	rshares	pct
lafona-miner	703,056,403,939	20%
tombstone	332,947,450,847	1.2%
simba	1,875,489,918	1.79%
kevinwong	231,433,074,710	3%
justtryme90	383,378,693,718	20%
anwenbaumeister	33,817,735,520	3.59%
mrwang	103,516,485	1.5%
raymondspeaks	260,747,713	1.79%
arconite	905,442,323	1.5%
lemouth	86,679,892,588	20%
rjbauer85	1,256,634,719	20%
anarchyhasnogods	28,184,024,974	8%
lamouthe	14,260,453,828	50%
votehumanity	1,127,801,569	1.79%
whoib	77,022,550	1.79%
curie	162,628,923,300	3.59%
hendrikdegrote	1,828,303,607,586	3.59%
vact	69,749,433,096	3.59%
steemstem	833,162,656,436	20%
dashfit	346,012,726	1.79%
sethroot	97,885,174	0.35%
foundation	2,771,227,598	20%
ixindamix	52,147,155,445	60%
the-devil	1,914,944,375	20%
thevenusproject	11,348,247,679	20%
dna-replication	5,631,920,009	20%
lenin-mccarthy	93,474,242	1.79%
resteemer	122,665,787	1.79%
pacokam8	262,295,163	1.43%
borislavzlatanov	1,764,532,151	20%
michelios	649,375,265	0.53%
awesomianist	248,464,853	0.71%
getrichordie	179,487,274	1.79%
jade56	476,587,540	10%
eurogee	296,013,775	2%
yeaho	236,821,597	9%
kryzsec	12,247,382,969	20%
upheaver	997,391,382	6%
fredrikaa	59,155,401,491	20%
tantawi	179,941,491	3.59%
minhnguyen1994	112,332,905	100%
locikll	1,496,769,130	7.18%
dber	12,807,680,057	20%
mahdiyari	13,609,315,255	10%
aboutyourbiz	636,557,608	3.59%
fanstaf	281,437,281	3.05%
kerriknox	4,379,594,343	20%
alexander.alexis	2,564,000,424	8%
howtostartablog	225,648,999	0.35%
blessing97	647,468,028	20%
saunter	5,199,388,812	20%
reseller	100,668,476	0.5%
rockeynayak	121,828,435	20%
ertwro	8,300,433,443	20%
ludmila.kyriakou	215,962,125	6%
nitesh9	5,029,265,536	20%
fancybrothers	3,706,014,903	6%
nolasco	243,089,111	0.17%
churchboy	3,526,813,383	20%
howo	24,841,718,360	10%
himal	1,541,806,422	20%
nitego	181,546,187	1.07%
abigail-dantes	317,732,129,767	20%
phogyan	123,146,796	1.79%
esteemguy	157,512,592	20%
suravsingh	265,182,589	20%
joe.nobel	1,649,212,660	10%
alexzicky	2,478,494,019	5%
mountain.phil28	3,619,369,984	25%
akeelsingh	837,681,806	20%
mountainwashere	8,196,601,223	20%
sharelovenothate	113,850,584	9%
metmuseum	48,776,949,626	20%
tanyaschutte	104,542,214	2%
zest	5,672,564,828	14%
felixrodriguez	641,793,145	10%
masterwriter	1,030,216,117	20%
honeysara	178,383,584	0.89%
massivevibration	2,202,528,711	5%
nurhayati	194,536,014	1.5%
evildido	26,157,343,841	100%
jefpatat	285,440,072	0.17%
laylahsophia	5,188,149,077	20%
clweeks	187,851,122	1.79%
pingcess	145,445,548	1.79%
damzxyno	164,501,475	4%
afrikablr	198,842,190	10%
birgitt	133,432,533	3.59%
mayowadavid	731,730,748	10%
poodai	153,491,950	1.79%
emdesan	456,307,089	10%
happychild	271,318,445	1.79%
peaceandwar	487,581,401	1.79%
enzor	320,619,000	10%
macmaniac77	216,374,422	1.79%
lekosvapenglass	124,818,275	40%
pratik27	740,072,826	10%
carloserp-2000	5,173,158,268	20%
rachelsmantra	858,236,329	20%
gra	7,031,281,039	20%
utopian-io	9,157,151,735,856	6%
tfcoates	506,378,784	5%
sci-guy	64,876,390	20%
janine-ariane	487,933,936	5%
drmake	2,536,515,614	1.79%
eleonardo	67,917,726	2%
vinxy	103,478,932	20%
sireh	274,826,420	0.35%
itchyfeetdonica	252,628,541	1.79%
physics.benjamin	210,564,475	20%
xanderslee	246,506,211	3.59%
kenadis	5,666,044,946	20%
awolesigideon	79,273,405	3.59%
amavi	3,123,437,227	4%
florae	1,165,936,397	20%
robotics101	942,022,537	16%
tristan-muller	130,053,037	20%
thescubageek	214,227,815	1.79%
fejiro	264,341,633	10%
aamin	389,947,864	10%
sco	2,292,892,710	4%
adetola	1,670,604,936	20%
rharphelle	1,930,929,963	25%
gordon92	152,377,409	1.5%
dysfunctional	1,177,238,948	10%
rasamuel	83,617,196	1.79%
catalincernat	358,689,577	3.59%
cordeta	73,178,609	1.79%
monie	431,761,027	100%
shoganaii	818,665,368	10%
laritheghost	151,331,707	1.79%
mathowl	3,030,005,922	20%
whileponderin	1,303,798,468	20%
jlmol7	67,049,120	20%
mittymartz	694,100,357	20%
hadji	576,258,425	20%
sakura1012	811,868,678	20%
terrylovejoy	3,586,818,944	8%
saunter-pl	353,406,098	20%
olajidekehinde	389,955,067	10%
real2josh	203,135,950	10%
debbietiyan	82,828,627	1.79%
steem-hikers	376,869,647	20%
kingabesh	856,022,415	10%
didic	607,098,995	1.79%
operahoser	234,858,688	0.89%
kelos	370,802,075	10%
dexterdev	1,648,113,041	20%
ugonma	930,872,753	20%
ajpacheco1610	376,529,558	10%
beladro	76,203,646	1.79%
vegan.niinja	85,844,254	1.79%
flugschwein	3,184,222,770	17%
charitybot	16,008,934,928	100%
lianaakobian	3,655,477,332	16%
steemtogether	80,083,826	10%
chimtivers96	186,021,587	3.59%
sissyjill	106,845,957	7%
amirdesaingrafis	87,525,175	1.79%
joelagbo	832,025,495	20%
morbyjohn	176,136,158	7%
anyes2013	265,892,913	10%
rerere	0	100%
theunlimited	61,115,083	10%
cryptoitaly	1,433,483,524	10%
hackerzizon	102,248,456	1%
effofex	710,280,693	10%
mrbreeziewrites	1,551,795,102	20%
de-stem	8,892,446,462	18%
derbesserwisser	5,120,620,183	25%
serylt	2,971,552,287	16%
yann85	396,715,094	12%
ari16	146,737,258	10%
event-horizon	202,069,105	20%
charitymemes	1,175,437,908	100%
michaelwrites	231,956,957	10%
chloroform	3,430,958,768	20%
vanessahampton	1,207,783,241	10%
temitayo-pelumi	1,294,733,902	20%
qberryfarms	97,475,532	1.79%
shookriya	110,662,627	0.71%
doctor-cog-diss	326,126,923	100%
niouton	259,954,230	0.71%
beautyinscience	61,251,219	10%
star-vc	815,448,100	20%
techupdate	104,360,664	1.79%
biomimi	238,622,672	40%
ibk-gabriel	171,568,728	10%
drsensor	265,327,418	6%
fischkopp	77,774,001	3.59%
conficker	1,409,379,913	20%
purelyscience	133,634,011	10%
oezixxx	75,769,761	3.59%
astrophoto.kevin	5,606,542,690	33%
schlunior	1,482,122,131	9%
call-me-howie	243,625,534	1.79%
hansmast	337,108,838	1.79%
osariemen	289,451,648	10%
testomilian	67,333,227	10.8%
mr-hades	550,672,761	100%
clement.poiret	4,828,640,074	100%
spoke	487,043,046	3.59%
techkajadi	121,712,931	20%
stem-espanol	1,786,993,298	20%
up-quark	4,288,286,829	20%
oladare	599,418,768	100%
upbeaver	101,218,364	1%
dna-polymerase	123,730,853	20%
dna-ligase	123,730,852	20%
dna-helicase	123,730,851	20%
dna-primase	123,730,850	20%
sliding-clamp	123,730,850	20%
clamp-loader	123,730,850	20%
dna-gyrase	123,730,849	20%
rna-polymerase	123,730,849	20%
ribosome	123,730,848	20%

`post_id`	56,874,057
`author`	steemstem
`permlink`	re-comment-fonctionne-un-reseau-de-neurones-retro-propagation-20180717t224445
`category`	fr
`json_metadata`	{}
`created`	2018-07-17 22:44:45
`last_update`	2018-07-17 22:44:45
`depth`	1
`children`	0
`net_rshares`	0
`last_payout`	2018-07-24 22:44:45
`cashout_time`	1969-12-31 23:59:59
`total_payout_value`	0.000 SBD
`curator_payout_value`	0.000 SBD
`pending_payout_value`	0.000 SBD
`promoted`	0.000 SBD
`body_length`	530
`author_reputation`	229,673,617,633,863
`root_title`	"Comment fonctionne un réseau de neurones ? - Rétro-propagation #2"
`beneficiaries`	`[]`
`max_accepted_payout`	1,000,000.000 SBD
`percent_steem_dollars`	10,000

`post_id`	56,874,119
`author`	utopian-io
`permlink`	20180717t224537464z
`category`	fr
`json_metadata`	{"app":"utopian-io","tags":["utopian.tip"]}
`created`	2018-07-17 22:45:39
`last_update`	2018-07-17 22:45:39
`depth`	1
`children`	0
`net_rshares`	0
`last_payout`	2018-07-24 22:45:39
`cashout_time`	1969-12-31 23:59:59
`total_payout_value`	0.000 SBD
`curator_payout_value`	0.000 SBD
`pending_payout_value`	0.000 SBD
`promoted`	0.000 SBD
`body_length`	420
`author_reputation`	152,913,012,544,965
`root_title`	"Comment fonctionne un réseau de neurones ? - Rétro-propagation #2"
`beneficiaries`	`[]`
`max_accepted_payout`	1,000,000.000 SBD
`percent_steem_dollars`	10,000