{"id":913,"date":"2012-11-11T22:08:00","date_gmt":"2012-11-11T20:08:00","guid":{"rendered":"http:\/\/sairanen.org\/wordpress\/2012\/11\/mitka-ovat-hyvat-sanat-blogiotsikoissa.html"},"modified":"2012-11-11T22:08:00","modified_gmt":"2012-11-11T20:08:00","slug":"mitka-ovat-hyvat-sanat-blogiotsikoissa","status":"publish","type":"post","link":"https:\/\/www.sairanen.org\/wordpress\/2012\/11\/11\/mitka-ovat-hyvat-sanat-blogiotsikoissa\/","title":{"rendered":"Mitk\u00e4 ovat hyv\u00e4t sanat blogiotsikoissa?"},"content":{"rendered":"<table cellpadding=\"0\" cellspacing=\"0\">\n<tbody>\n<tr>\n<td><a href=\"http:\/\/1.bp.blogspot.com\/-HEBb1LsaxJk\/UJ_3aM46h9I\/AAAAAAAABVU\/RYUOALuwoNQ\/s1600\/jaot.png\" imageanchor=\"1\"><img loading=\"lazy\" decoding=\"async\" border=\"0\" height=\"214\" src=\"http:\/\/1.bp.blogspot.com\/-HEBb1LsaxJk\/UJ_3aM46h9I\/AAAAAAAABVU\/RYUOALuwoNQ\/s320\/jaot.png\" width=\"320\"><\/a><\/td>\n<\/tr>\n<tr>\n<td>Artikkelien m\u00e4\u00e4r\u00e4 suhteessa jakoihin (100 tai alle jakoa saaneet artikkelit)<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Olen <a href=\"http:\/\/heikkisairanen.blogspot.fi\/2012\/05\/yhteenveto-milloin-blogikirjoitus.html\">aiemminkin purkanut blogissani CrCo-dataani<\/a>. Datasettin\u00e4 on 2046 blogikirjoitusta erilaisilta ViNOlaisilta blogaajilta ja niiden jaot Facebookissa. Olen karsinut datasta ei jaettuja viestej\u00e4 ja kirjoituksia, joiden Facebook-jakoja j\u00e4rjestelm\u00e4 ei viel\u00e4 ole ehtinyt ottaa. Facebook-jakoihin lasketaan t\u00e4ss\u00e4 ainakin tykk\u00e4ykset, jaot ja kommentit artikkeliin liittyen.<\/p>\n<p>T\u00e4ll\u00e4 kertaa tutkin blogikirjoitusten otsikoiden suhdetta jakoihin.<\/p>\n<p>Blogikirjoitusten otsikon pituus ei vaikuta jakojen m\u00e4\u00e4r\u00e4\u00e4 niin, ett\u00e4 saisin sit\u00e4 eroa tilastollisesti esiin. Voi olla, ett\u00e4 eroa voisi v\u00e4h\u00e4n muodostua erilaisella analyysill\u00e4, mutta mitk\u00e4\u00e4n yksinkertaiset menetelm\u00e4t eiv\u00e4t tuoneet eroja esiin.<\/p>\n<p>Analysoin samalla er\u00e4it\u00e4 mieleeni p\u00e4lk\u00e4ht\u00e4neit\u00e4 sanoja tai sanan osia. On huomattava, ett\u00e4 tein haut siten, ett\u00e4 my\u00f6s v\u00e4leill\u00e4 oli merkist\u00e4. Eli esimerkiksi blogikirjoitus, joka alkaa sanalla \u201cVihre\u00e4t\u201d ei tartu mukaan, hakuun \u201c_Vihre\u00e4t_\u201c, miss\u00e4 _-merkill\u00e4 merkitsen v\u00e4lej\u00e4. Samoin haut tekev\u00e4t eron ison ja pienen kirjaimen v\u00e4lill\u00e4, joten my\u00f6sk\u00e4\u00e4n \u201cvihre\u00e4t\u201d haku ei tuohon osuisi.<\/p>\n<p>Sanat on valittu t\u00e4ysin satunnaisesti ja jos keksitte mielenkiintoisia sanoja, voin miell\u00e4ni katsoa, mit\u00e4 tietokanta sanoo niist\u00e4.<\/p>\n<p>Tilastollisesti merkitt\u00e4v\u00e4sti jakoa helpottavia sanoja (p < 0,05):\n\n\n\n<ul>\n<li>Vihre\u00e4<\/li>\n<li>nuoret<\/li>\n<li>?<\/li>\n<li>puheenjohtaja<\/li>\n<li>_ja_<\/li>\n<li>min\u00e4<\/li>\n<\/ul>\n<p>Tilastollisesti ehk\u00e4 jakoa helpottavia sanoja (0,05 < p < 0,1):\n\n\n\n<ul>\n<li>politiikka<\/li>\n<\/ul>\n<p>Sanoja jotka eiv\u00e4t kuulu n\u00e4ihin kategorioihin eli sanoja, joilla ei ole merkityst\u00e4 tilastollisesti<\/p>\n<ul>\n<li>_on_<\/li>\n<li>vihre\u00e4<\/li>\n<li>tekee<\/li>\n<li>ismi<\/li>\n<li>Helsinki<\/li>\n<li>Kallio<\/li>\n<li>luonto<\/li>\n<li>ymp\u00e4ris<\/li>\n<li>peruss<\/li>\n<li>hyv\u00e4<\/li>\n<li>homo<\/li>\n<li>usko<\/li>\n<li>koulu<\/li>\n<li>netti<\/li>\n<li>!<\/li>\n<li>Kuka<\/li>\n<li>Miten<\/li>\n<li>Voiko<\/li>\n<li>tie<\/li>\n<li>varapuheenjohtaja<\/li>\n<li>hallitus<\/li>\n<li>velka<\/li>\n<li>k\u00f6yh\u00e4<\/li>\n<li>tulee<\/li>\n<li>seksi<\/li>\n<li>nainen<\/li>\n<li>kansa<\/li>\n<li>_ovat_<\/li>\n<\/ul>\n<p>Tilastollisesti ehk\u00e4 jakoa vaikeuttavia sanoja (0,05 < p < 0,1):<br \/>Suomi<\/p>\n<ul>\n<li>olisi<\/li>\n<\/ul>\n<p>Tilastollisesti merkitt\u00e4v\u00e4sti jakoa vaikeuttavia sanoja (p < 0,05):\n\n\n\n<ul>\n<li>_ei_<\/li>\n<li>Tampere<\/li>\n<li>Turku<\/li>\n<li>ajaa<\/li>\n<li>EU<\/li>\n<li>kunta<\/li>\n<li>kaupunki<\/li>\n<li>Miksi<\/li>\n<li>talous<\/li>\n<li>ei ole<\/li>\n<li>sukupuoli<\/li>\n<li>sin\u00e4<\/li>\n<li>me<\/li>\n<li>sana<\/li>\n<li>blogi<\/li>\n<\/ul>\n<p><\/p>\n<div>On hankala sanoa mit\u00e4\u00e4n suurempaa n\u00e4ist\u00e4 listoista. Monet sanat selittyv\u00e4t varsin yksinkertaisilla syill\u00e4. Esimerkiksi puheenjohtaja-sana ilmenee hakemuksissa puheenjohtajiksi\u00a0tai muiden tukiviesteiss\u00e4. Mukana on my\u00f6s virallisia kannanottoja, jotka tuntuvat ker\u00e4\u00e4v\u00e4n v\u00e4h\u00e4n enemm\u00e4n jakoja, kun j\u00e4rjest\u00f6n j\u00e4senet jakavat viesti\u00e4 eteenp\u00e4in.<\/div>\n<div><\/div>\n<div>Mielenkiintoisimmat poiminnat ovat nuo negatiivisesti jakoihin vaikuttavat sanat. Ne vaikuttvat varsin byrokraattisilta asioilta (EU, kunta, kaupunki) tai pienemm\u00e4n piirin kannalta mielenkiintoisilta asioilta (Turku, Tampere). Mielenkiintoista.<\/div>\n<div><\/div>\n<div>Ongelmia metologiasssani on paljon. Kyseess\u00e4 on p\u00e4\u00e4asiassa ViNOlaisten aktiivien kirjoituksista eli tuloksia ei todellakaan voi suoraan yleist\u00e4\u00e4 ainakaan t\u00e4m\u00e4n joukon ulkopuolelle. Toisaalta data itsess\u00e4\u00e4n on v\u00e4h\u00e4n huonosti ker\u00e4tty\u00e4 ja sis\u00e4lt\u00e4\u00e4 ainakin jonkin verran duplikaatteja. T\u00e4m\u00e4 voi v\u00e4\u00e4rist\u00e4\u00e4 vastauksia jonkin verran, mutta vahivimpien l\u00f6yt\u00f6jen luulisi pit\u00e4v\u00e4n silti.<\/div>\n","protected":false},"excerpt":{"rendered":"<p>Artikkelien m\u00e4\u00e4r\u00e4 suhteessa jakoihin (100 tai alle jakoa saaneet artikkelit) Olen aiemminkin purkanut blogissani CrCo-dataani. Datasettin\u00e4 on 2046 blogikirjoitusta erilaisilta ViNOlaisilta blogaajilta ja niiden jaot Facebookissa. Olen karsinut datasta ei jaettuja viestej\u00e4 ja kirjoituksia, joiden Facebook-jakoja j\u00e4rjestelm\u00e4 ei viel\u00e4 ole ehtinyt ottaa. Facebook-jakoihin lasketaan t\u00e4ss\u00e4 ainakin tykk\u00e4ykset, jaot ja kommentit artikkeliin liittyen. T\u00e4ll\u00e4 kertaa tutkin [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[259],"tags":[],"class_list":["post-913","post","type-post","status-publish","format-standard","hentry","category-yleinen"],"_links":{"self":[{"href":"https:\/\/www.sairanen.org\/wordpress\/wp-json\/wp\/v2\/posts\/913","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.sairanen.org\/wordpress\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.sairanen.org\/wordpress\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.sairanen.org\/wordpress\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.sairanen.org\/wordpress\/wp-json\/wp\/v2\/comments?post=913"}],"version-history":[{"count":0,"href":"https:\/\/www.sairanen.org\/wordpress\/wp-json\/wp\/v2\/posts\/913\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.sairanen.org\/wordpress\/wp-json\/wp\/v2\/media?parent=913"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.sairanen.org\/wordpress\/wp-json\/wp\/v2\/categories?post=913"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.sairanen.org\/wordpress\/wp-json\/wp\/v2\/tags?post=913"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}