DamezrandinaDibistana navîn û dibistanên

Herî nêzîk rêbaza cîranê: nimûne ji kar

ya herî nêzîk li rêbaza cîranê herî hêsan classifier metric e, ku li ser nirxandina mîna yên hêmanên cuda bingeh e.

object analîz dike ji aliyê çîna ku ew girêdayî mijarên test perwerdeya. Werin, em dibînin ku ji ku ya herî nêzîk ji cîranê. Hewl bide ku fêm wê mijarê tevlîhevtir, wergerandî yên bi teknîkên cuda.

rêbaza hîpoteza

rêbaza herî nêzîk cîranê dikare wek rêbazeke hevpar herî pir tê bikaranîn ji bo Dabeşandina hesibandin. Object serpêyî Dabeşandina ye ji y_i class de, ji bo ku ya herî nêz object fêrbûna test x_i.

Yên di rêbazên herî nêzîk cîranên

k rêbaza herî nêzîk cîranê xwe jî ji bo şaşitî Dabeşandina baştir. object analîz dike ye ji di heman polê de wek ko ji cîranên xwe re, ku ew e, k close to it ji x_i test analîzkirin biçük. Di çareserkirina pirsgirêkên bi du çînên ji hejmara yên cîranên etîketeke nekevin rewşa nezelalî be, eger di heman hejmara cîranên ji çîn û tebeqeyên cuda aîdî wê.

Ku di teknîkê de ji cîranên xwe rawestandin

method-PostgreSQL analîzkirin tsvector herî nêzîk cîranên xwe tê bikaranîn, gava ku hejmara dersên bi kêmanî sê, û tu an zede bi kar tînin ne. Lê belê, nezelalî û çebû, heta di van dozan de. Hingê, ji cîranê i-th de bikeve weight w_i, ku bi rank cîranê ya i kêmbe. Ev ji bo ku çîna ji object, ku dê giraniya herî zêde bi tevahî di nav cîranên hev heye, behsa.

Hîpoteza ji compactness

Li dilê hemû rêbazên li ser hîpoteza ji compactness e. Ev pêşniyar dike girêdanek di navbera pîvana mîna yên objects û mensûbê wan ji bo di heman polê de. Di vê rewşê de, sînora navbera cureyên cuda şêweyekê sade ye, biafirînin û dersên ji tiştên di qada herêma mobile nasandin. Di van herêmên di nivîsa bîrkariyê de hatin binçavkirin bi wateya a set zikra girtin. Ev peresendî ji bo têgihiştina rojane yên ku peyva related ne.

The formula bingehîn

Bila ji me re bêtir herî nêzîk cîranê biceribînim. Eger perwerdeya pêşniyar type test "object-bersiva» X ^ m = \ {(x_1, y_1), \ zanyarîyan de, (x_m, y_m) \}; eger pirrengîyeke ji tiştên ji bo danasîna ji dûr ve fonksiyona \ Rho (x, x '), ku di form of an model mîna têrkir objects bi nûnertiya zêdekirina nirxê function kêm di navbera hêmanên x, x'.

Ji bo tu object, u ava wê test perwerdeya biçük x_i bi zêdebûna dûr û ji bo u:

\ Rho (u, x_ {1; u}) \ leq \ Rho (u, x_ {2; u}) \ leq \ cdots \ leq \ Rho (u, x_ {m; u}),

ku x_ {i; u} karekterîze ku test fêrbûna object, e ku i-th object source cîranê u. Wiha dinivîse û bikaranîna ji bo bersiva ji cîranê i-th: y_ {i; u}. Wek encam, em dibînin ku tu object u provoke dike renumbering testa xwe.

Destnîşankirina de hejmara k yên cîranên

herî nêzîk rêbaza cîranê dema k = 1 jêhatî dayîna an Dabeşandina, sube, ne bi tenê li ser hêmanên-gazên, di heman demê de jî ji bo çînên din ên ku nêzîk e.

Heger em k = m, algorîtmaya wê bibe wek aram û bi ewê nav nirxê berdewam dejenere bike. Ji ber vê yekê bi Turkîyê girîng e, ji bo ku nîşanên extreme k.

Di pratîkê de, pîvana wek index k aşitixwaz tê bikaranîn de, dişemite kontrolê.

gazên nîşandanên

Berhemên ji xwendinê bi giştî ya newekhev, di heman demê de di nav wan de kesên ku xwedî taybetmendiyên çîna û bi ji bo ku standardên sewqî hene. Li nêzîkbûna mijarê de ji bo modela îdeal ya bi îhtimaleke mezin wê ji bo mensûbên vê sinifê.

Çawa rezultativen rêbaza yên herî nêzîk cîranên? An nimûne dikare li ser bingeha categories kevîyan û non-agahdarkirinê yên objects dîtin. Ev Tê texmînkirin jîngehê dagirtî ji object nûnerên din yên vê çîna. Gava ku tu wan ji Dabeşandina ji alîyekî ve bi kalîte ne wê cefayê bikişîne jê.

Get nav hejmarek ji tehlîl dikarin teqîna dengî ku ne "li ser erdê" çîneke. Jêbirin bandora ji bihaya erênî ya li ser kalîteya li Dabeşandina.

Ger ku test ji hêmanên dengî uninformative û ji holê rakirin, tu dikarî li ser çend encamên erênî di heman demê de count.

Yê pêşî rêbaza interpolation yên herî nêzîk a Dabeşandina cîranê destûrê ji bo çêtirkirina kalîteya, kêm û bisînor bûna daneyan, kêmkirina dema Dabeşandina, ya ku li ser hilbijartina ji pîvanên din de bûn.

Bikaranîna testên ultra-large

rêbaza herî nêzîk cîranê ye, ku li depo rast ji objects fêrbûna bingeha. Ji bo afirandina pir testa mezin bikaranîna pirsgirêkeke teknîkî. Mebest ne ew e, çawa ji bo rizgarkirina beşekê girîng ya agahî, di heman demê de jî di kêm amount of time demê bibînin ku ti object u di nava herî nêzîk cîranên k xwedî.

To qasekî bi vî karî, du rêbazên bi kar tînin:

  • test thinned rêya objects bidawîbûna non-welat;
  • bikaranîna avaniya bi bandor daneyên taybet û kodên ji bo lêgerîn mêvanî yên herî nêzîk li cîranên xwe.

Rules of rêbazên selection

The Dabeşandina li jor hate hesibandin. rêbaza herî nêzîk cîranê ku di çareserkirina pirsgirêkên pratîk e, ku di pêş zanîn ji dûr ve fonksiyona \ Rho bikaranîn (x, x '). Di objects danasîna vectors hejmar bikaranîna metric Euclidean. Ev hilbijartina heye Ti hencetek taybet, di heman demê de dimeşin pîvandinê de ji hemû nîşaneyên "ya di pîvaneya heman." Eger ev faktora tê hesibandin ne, piştre metric dê taybetiya ku bilindtirîn nirxên hejmar predominate.

Ger e, xebateke girîng ya features, hesab ji dûr ve wek sum ji, daku li ser nîşanên taybet li wê derê xuya aliyê pirsgirêka cidî.

Di qada bilind liber dûr ji yekî din ê hemû hêmanên. Di dawiyê de, ti nimûneyên wê next to the object ku xwendiye k cîranên. hilbijartin hejmareke piçûk taybetiyên agahî û ji bo nehiştina vê pirsgirêkê. Algorîtmayên bo hejmartina texmînên avakirina li ser bingeha komên cuda yên nîşanan, û ji bo her kesî avakirina function nêzîkbûna xwe.

encamê de

Hesabkirina Mathematical caran karanîna yên cîhêreng ên ji teknîkên ku xwe taybetmendiyên cuda, awantaj û dezawantajên xwe. rêbaza Viewed herî nêzîk cîranê dikarin pir pirsgirêkek cidî ji ber taybetiyên objects bîrkariyê de çareser bike,. The konsepta ceribandinê de, li ser bingeha rêbaza analîzê tê aktîv di çêkirî tê bikaranîn.

Di sîstemên pispor ji ew ne bi tenê ji bo bisenifînin objects, di heman demê de jî nîşan user ber edliyeyê ji Dabeşandina di pirsa pêwîst e. Di vê rêbazê de, bo ravekirina vê diyardeyê bi di têkiliyên bi object of a çîna taybet û herweha ciyê wê nisbî ji bo ku test bête bi kar anîn ziman. pisporên sektora Yasayî, erdnasan, pizişk, vê "precedent" mantiqa aktîf bi kar di lêkolînên xwe.

Ji bo ku were analîz rêbaza dawî ya herî emîn, efektîv, dayîna de bi encam bibe, hûn divê herî kêm hêjmar k bigirin, dema gazên nav objects analîzkirin jî nekevin. Ji ber vê yekê bikaranîna standartên me û rêbaza hilbijartinê de, herweha metrics optimization de.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 ku.atomiyme.com. Theme powered by WordPress.