ponedeljek, 2. julij 2018

Velika števila

Priznam, da je bila statistika tako brezpredmetna kot filozofija. Preveč vsega je bilo v zraku in vse nepovezano. Čeprav je marsikdo mislil, da sem jo razumel, oziroma jo obladam, jaz tega občutka nikoli nisem imel. Razumel sem osnove, potem pa se je izgubila vsaka sled. Zato sem v tem mesecu iz zanimanja prebral dve knjigi, da bi jo končno razumel, in lahko zaključim, da je jo je mogoče razdeliti na štiri dele: štetje, porazdelitve, testiranje hipotez in napovedovanje.

Najprej imamo podatke na katerih se izvedejo razne statistike. Statistika v bistvu pomeni kakršno koli operacijo ali skupek operacij nad podatki. Primeri statistk so izračun povprečja, izračun standardnega odklona, izračun interkvartilnega razmika ipd. Na kratko; vse gre po forumulah, kjer pa se sreča prvo izjemo. Kar naenkrat povsod delimo z n (številom podatkov) razen v primeru standardnega odklona, kjer delimo z n minus ena.

Vse te formule pridejo iz formul za cenilke izbrane porazdelitve. Največkrat se za podatke, ki si jo lahko prestavljamo kot tir, kjer je vlak slučajna spremenljivka, predpostavi normalna (Gaussova) porazditev, ki v resničnosti ne obstaja: nikoli ne bomo imeli podatkov iz resničnosti, ki bi tej porazdelitvi ustrezali, torej se v ozadju naredi nekaj predpostavk. Obstaja še cela vrsta porazdelitev, znana je naprimer: Studentova t-porazdelitev, in iz porazdelitev slučajnih spremenljivk nastanejo testi.

Testiranje hipotez sestoji iz ničelne hipoteze in alternativne. Pri ničelni hipotezi se vedno testira enakost z neko vrednostjo, zato so alternativne vedno enostanske ali obojestranske. Dve strani obstajajata zaradi intervala zaupanja, ta pa je odvisen od stopnje tveganja oziroma stopnje značilnosti. Če naš test zadane interval, nam test ničesar ne pove; če ne zadane, hipotezo zavrnemo. Ker se v nekaterih izračunih intervalov pojavljajo magične vrednosti, je testiranje eno samo preračunavanje po receptih, skratka nič zanimivega, naprimer iz Studentove t-porazdelitve nastane t-test, ki se uporablja za testiranje pričakovane vrednosti, kadar standardni odklon ni znan. Če je pa znan, pa se uporabi z-test. Čisti recepti. Nekaj več dela je z t.i. multivariatno analizo, kjer se primerja dve porazdelitvi ali več, ampak zopet gre vse po formulah.

Zadnja stvar, napovedovanje, je še najbolj zanimivo. Nekateri temu rečejo regresija. Postopki pa so popolnoma enaki tistim, ki jih v geodeziji poznajo pod pojmom izravnalni račun. K napovedovanju spada tudi umetna inteligenca, kjer je največji izziv podatke; naprimer sliko; pretvoriti v števila in potem nazaj.

Toliko o tem.

sobota, 30. junij 2018

Kriva razvada

Slovenščina je bogati jezik, pa ne po količini besed, temveč po številu narečjih. V Beli krajini, morda le petdeset kilometrov stran, čez Gorjance, govorijo tako, da ni mogoče razlikovati ali za gre za Slovenca ali za Hrvata, ki se je dobro naučil slovenščine. Njihova govorica je prepolna besed „da, da“ in „zovi“ sicer pa poslušljiva, česar pa ne morem reči za tiste, ki prihajajo iz okolice Nove Gorice. V srednji šoli sem imel sošolko iz okolice Novega mesta, ki je včasih poudarjala napačne samoglasnike. V glavi mi je ostala njena beseda „zápor“ oziroma beseda s takrat ne najbolj jasnim pomenom. Pravilno bi bilo zapòr.

Morda je krivo tudi to, da v pisanih besedilih ne zapisujemo naglasov oziroma da se jih naučimo le skupaj z izgovorom besed.

Narečja se torej razlikujejo v naglaševanju (poudarjanju) črk in izbiri besedišča, vendar me najbolj moti pomanjkanje prilagodljivosti govorca. Če ta ve ali pa vsaj ima občutek, da sogovorec ne prihaja iz istega območja, bi se lahko potrudil in izbiral besede z jasnim pomenom. Pri televizijskih, radijskih in podobnih voditeljih je meni najpomembnejša lastnost njihova zmožnost govoriti neobarvano. Žalostno niso vsi voditelji tega sposobni.

Kot že nakazano je nekaj narečnih besed nastalo iz tujih besed. Če se izgovor ni spremenil, je s poznavanjem tujega jezika lažje ugotoviti njen pomen. Čeprav je veliko besed prišlo iz nemščine in so postale bodisi tujke bodisi so postale del narečij, ne vidim nikakršnega razloga, da bi uporabljali tujo besede, če poznamo slovensko. Kriva razvada?

petek, 29. junij 2018

Besede abecede

Tudi četrti poskus sestavljanke ni obrodil sadov. Na videz je vse logično, ampak kot celota me pesti eni in isti problem. Morda je ta tudi razlog, da takšne še ni sestavil nihče, tudi jaz ne.

Takšno je bilo moje včerajšnje mnenje, danes pa sem posumil, da ena metoda preverjanja ne daje pravih rezultatov.

Omenjeno metodo mi predstavlja poceni sestavljanka, ki ima skoraj vse lastnosti razen ene (dodatne, katero želim jaz) in jo uporabljam kot vzorec. Včeraj pa vzorec ni uspel zagotoviti osnovne lastnosti, zato je za nadaljnja preverjanja naročen malo drugačen vzorec.

Druga metoda preverjanja sestoji iz enega elementa, katerega se naknadno doda in ne sme spremeniti osnovne lastnosti. Pri ponovnem preverjanju se je izkazalo, da tudi tretji poskus včasih prestane drugo preverjanje, vendar takšno obnašanje zame ni sprejemljivo.

Sem pa pri načrtovanju naredil še eno napako, in sicer sem napačno izračunal presečišče, zato luknje niso na pravem mestu in element se ne usede.