perjantai 8. heinäkuuta 2011

Normaalijakauman ongelmat

Talousteorian perinteiset mallit perustuvat satunnaismuuttujaan, jonka oletetaan olevan normaalijakautunut. Tyypillinen malli (mm. Black-Scholes, ks. http://en.wikipedia.org/wiki/Black–Scholes) esittää kurssin random walkina:

,

missäeli muutoksia kurssissa mallinnetaan satunnaismuuttujalla, joka on normaalijakautunut, ja aikasarjoja käsitellään logaritmisella asteikolla. Jos tämä malli vastaisi todellisuutta, mallintaminen olisi suhteellisen helppoa. Normaalijakaumat nimittäin summautuvat kivasti:

,
missä . Tästä seuraa, että myös kaikkien yksittäisten muutosten summa on normaalijakautunut.

Normaalijakauman odotusarvo olisi myy, mutta koska muutoksia tarkastellaan logaritmisella asteikolla, odotusarvo on jotain muuta:

,
missä. Näin ollen suuremman varianssin omaavat osakkeet saisivat suuremman odotusarvon. Tämä vastaa intuitiivisesti ajatusta siitä, että suuremmalla riskillä voi odottaa suurempaa tuottoa.

Kylmä todellisuus
Kaikki hyvin tähän asti. Missä siis vika? Katsopa Kuvaa 1. Siinä on OMXH25-indeksin muutokset esitettynä logaritmisella asteikolla. Datasta on laskettu keskihajonta olettaen normaalijakauma, ja muutokset on esitetty suhteessa keskihajontaan. Suurimman osan ajasta muutokset pysyvät parin kolmen keskihajonnan sisällä. Mutta 10 vuoden dataan mahtuu myös neljän, viiden ja jopa yli kuuden keskihajonnan päivämuutoksia. Entä sitten?
Kuva 1. OMXH25-indeksin muutokset 10 vuoden ajalta. Vaaka-akselilla on aika ja pystyakselilla päivämuutos keskihajonnan avulla esitettynä.
Normaalijakauma ennustaa, että itseisarvoltaan neljän keskihajonnan muutoksen todennäköisyys on 1 : 15 787 eli keskimäärin tuollaisia muutoksia sattuu kerran 43 vuodessa. Itseisarvoltaan viiden keskihajonnan muutoksen todennäköisyys on 1 : 1 744 154 eli keskimäärin niitä olisi odotettavissa kerran 4 779 vuodessa. Itseisarvoltaan kuuden keskihajonnan muutoksen todennäköisyys olisi 1 : 506 791 044 eli niitä tapahtuisi kerran 1 388 469 vuodessa. Ja kuitenkin kymmenen vuoden ajanjaksoon mahtui kaksi yli kuuden keskihajonnan muutosta, kolme yli viiden keskihajonnan muutosta, ja kuusi yli neljän keskihajonnan muutosta. Onko siis todennäköistä, että normaalijakauman oletus pitäisi paikkansa?

Tein vielä kaiken varalta Anderson-Darling -testin, jolla voidaan tarkistaan, noudattaako jokin otos normaalijakaumaa (ks. http://en.wikipedia.org/wiki/Anderson–Darling_test). Sain:n arvoksi sain 22,2. Testin raja-arvo 0,5 %:n merkittävyystasolla on 1,159. Koska saatu arvo ylittää näin kirkkaasti raja-arvon, ei ole epäilystäkään siitä, että oletus normaalijakautuneisuudesta on hylättävä.

Mitä tästä seuraa?
Tilastomatematiikassa on teoria nimeltä Central Limit Theorem (CLT). Se ennustaa, että kun lasketaan yhteen riittävän suuri määrä itsenäisiä satunnaismuuttujia, joilla on äärellinen keskiarvo ja varianssi, summa lähenee normaalijakaumaa, riippumatta siitä, mikä on alkuperäinen jakauma, jota satunnaismuuttujat noudattavat. Kuva 2 havainnollistaa asiaa. Siinä aloitetaan jakaumasta, joka ei todellakaan näytä normaalijakaumalta. Kun summataan kaksi satunnaismuuttujaa (konvoloidaan jakauma itsellään), tulos muistuttaa jo hiukan normaalijakaumaa. Kolmannen ja neljännen summausaskeleen (konvoluutio alkuperäisen jakauman kanssa) jälkeen saadaan jo käyriä, joita ei harjaantumaton silmä erota normaalijakaumasta.
Kuva 2. Alkuperäinen jakauma on kuvattu ylhäällä vasemmalla. Ylhäällä oikealla on kahden satunnaismuuttujan summa, alhaalla vasemmalla kolmen ja alhaalla oikealla neljän. Muoto alkaa muistuttaa normaalijakaumaa, mitä enemmän satunnaismuuttujia lisätään. (Lähde: http://en.wikipedia.org/wiki/Central_limit_theorem)
CLT on matemaattinen tosiasia. Sitä ei voi kiistää. Jos siis teoreeman oletukset täyttyisivät, pitäisi myös pörssikurssien noudattaa normaalijakaumaa, kun tarkastellaan suurta määrää havaintoja aika-askelilla. Koska äsken osoitettiin, että edes indeksi, joka jo itsessään on summa useista osakekursseista, ei noudata normaalijakaumaa, on oltava niin, että jokin CLT:n soveltamiseksi tarvittavista oletuksista ei pidä paikkaansa. Oletuksiin kuului mm. että alkuperäisellä jakaumalla on oltava äärellinen keskiarvo ja varianssi. Voisiko olla niin, että nämä oletukset eivät pitäisi paikkansa?

Idea siitä, että jokin muu kuin normaalijakauma esittäisi paremmin osakekursseja, ei ole uusi. Benoit Mandelbrot esitti jo vuonna 1963, että Lévy-jakauma sopisi paremmin niiden mallinnukseen (The Journal of Business, Vol. 36, No. 4 (Oct., 1963), pp. 394-419). On huomattavaa, että log-Lévy-jakaumalla ei ole äärellistä keskiarvoa tai varianssia, minkä vuoksi CLT:tä ei voida soveltaa siihen.

Normaalijakaumaa käytetään tieteellisessä maailmassa paljon sen helppouden takia ja siksi että CLT:tä voidaan soveltaa useissa tapauksissa. Monesti on aivan oikein käyttää normaalijakaumaa. Taloustieteessä ja rahoituksen alalla asia ei kuitenkaan näyttäisi olevan näin. Yksinkertaisena esimerkkinä olkoon varallisuuden jakautuminen. Se ei noudata normaalijakaumaa. Esimerkiksi USA:ssa 1 % väestöstä omistaa 40 % koko varallisuudesta. Luvut eivät sovi mitenkään normaalijakaumaan. Tämäkään ajatus ei ole mitenkään uusi. Vilfredo Pareto huomasi vastaavan ilmiön jo 1800-luvun lopulla (ks. Pareto, V., 1897, Cours d’Economique Politique, Vol 2. Tai käännös: Manual of Political Economy, New York: Augustus M. Kelley, 1971).

Kun normaalijakaumaa yritetään sovittaa todelliseen kurssidataan, huomataan, että lähellä keskiarvoa olevan datan saa sopimaan siihen kohtuullisesti, mutta "hännät" ovat liian pitkät. Tämä todettiin jo edellä OMXH25-indeksiä testattaessa, kun löydetiin jopa kuuden keskihajonnan muutoksia. On helppo hylätä nämä epämiellyttävät dataelementit outliereina. Aina ei ole väärin hylätä outliereita. Esimerkiksi, jos tehdään mittauksia, joilla yritetään vahvistaa jokin fysiikan laki, kaukana oletetusta tuloksesta olevat mittaustulokset voidaan yleensä hylätä mittausvirheinä. Jos vaikkapa tarkastellaan kuvaajaa, joka on piirretty mittaustulosten perusteella ja kaikki datapisteet osuvat mukavasti suoralle, mutta yksi on kaukana sen ulkopuolella, on oikein hyvätä tuo piste ja sovittaa suora jäljelle jääviin datapisteisiin. Usein myös outlierien vaikutus kokonaisuuteen on marginaalinen, jolloin voi olla aivan sama, otetaanko ne huomioon vai ei.

Nyt, olisi suuri houkutus hylätä myös osakekurssidatasta suurimmat muutokset outliereina, jolloin normaalijakauma sopisi dataan. Tämä ei kuitenkaan olisi älyllisesti rehellistä toimintaa. Osakekurssien kaltaisessa aikasarjassa suurilla muutoksilla on suuri vaikutus, koska vaikutukset kumuloituvat. Vaikka ne olisivat suhteellisen harvinaisia, niitä ei voi jättää huomiotta.

Mustat joutsenet
Kirjassan The Black Swan (Random House, New York, 2010) Nassim Taleb pohdiskelee tällaisten erittäin epätodennäköisten tapahtumien vaikutusta ja kritisoi myös normaalijakauman väärää käyttöä. Termi "black swan" viittaa erittäin epätodennäköiseen tapahtumaan, jolla on suuri vaikutus, ja jolle jälkikäteen on keksittävissä selitys, mutta jota ei pysty ennustamaan etukäteen. Rahoituksen alalla nämä mustat joutsenet ilmenevät mm. suurina äkillisinä muutoksina osakekursseissa. Mikään riskianalyysi ei pysty ennustamaan näitä muutoksia, mikä on ihmisille vaikeaa hyväksyä. Kaikkea halutaan hallita.

Asiantuntijat piileskelevät normaalijakauman suojissa, jolloin vuoden 1987 mustan maanantain tai 11.9.2001 terrori-iskun kaltaiset tapahtumat eivät ole tästä keskiarvoisesta maailmasta (Nassim Taleb käyttää termiä Mediocristan maailmasta, jossa normaalijakauma toimii, ja termiä Extremistan maailmasta, jossa se ei toimi - eli siis siitä maailmasta, jossa me elämme). Jälkeenpäin sitten kyllä keksitään selityksiä, ja jopa varaudutaan seuraavaan lentokoneiskuun pilvenpiirtäjään, mutta ei tajuta, että seuraavan kerran musta joutsen on jotain aivan muuta. Jotain mikä ei nyt tule mieleenkään.

Kaikki perinteiset riskienhallinta menetelmät epäonnistuvat mustien joutsenten suhteen. Se ei silti tarkoita, etteikö niiden kanssa voisi tulla toimeen. Edellä mainittu Nassim Taleb on toiminut hedge-rahaston hoitajana ja traderina Wall Streetilla. Hän onnistui myös hyötymään suuresti viimeisimmästä (vuoden 2008) taloudellisesta kriisistä. Siitä, miten hän tämän teki, löytyy vihjeitä hänen kirjoissaan, mutta lukijalle jätetään tehtäväksi täyttää puuttuvat palaset. Vaikka en aivan kaikkea hänen kirjansa ajatuksia purematta niele, henkilökohtaisesti aion kuitenkin soveltaa joitakin hänen oppejaan riskienhallinnasta heti, kun siihen kykenen. Tehtävä ei nimittäin ole aivan helppo.

3 kommenttia:

  1. Kirjoittaja on poistanut tämän kommentin.

    VastaaPoista
  2. Mikäli random walkin "päiväaskeleet" X ovat 1) riippumattomia, 2) samalla tavalla jakautuneita, ja 3) varianssiltaan äärellisiä, pitäisi pidempien (log-)hinnanmuutosten (esim. "kuukausiaskeleiden") olla normaalijakautuneita (CLT:n nojalla).

    (Juuri tämän vuoksi random walk -malleissa rajoitutaan normaalijakaumaan: tarpeeksi suurella mittakaavalla kaikki random walkit -- oletusten 1, 2 ja 3 täyttyessä -- näyttävät perustuvan normaalijakaumaan.)

    Selvää on, ettei OMXH25-hinnanmuutosten varianssi ole äärellinen. Sain MATLABilla hinnanmuutosten stable distribution -alfaksi noin 1.66, eli häntien paksuus on jossain normaalijakauman (alfa=2) ja Cauchy-jakauman (alfa=1) välillä.

    VastaaPoista
  3. Mielenkiintoista. Mandelbrot sai tuossa yllä mainitussa paperissa puuvillan hintoja tarkastellessaan alphaksi 1.7, mikä on melkein sama kuin tuo 1.66. Ehkäpä osakkeiden hinnat käyttäytyvät siis samaan tapaan.

    Tuo Mandelbrotin paperi tuntuu jotenkin unohtuneen, koska Black, Scholes, ja Merton kaikesta huolimatta kirjoittivat omasta normaalijakaumaa hyödyntävästä teoriastaan paperin kymmenen vuotta sen jälkeen, ja pokkasivat vielä siitä hyvästä Nobel-palkinnon.

    VastaaPoista