neděle 31. srpna 2014

Datový žurnalismus

Nastal konec semestru, a když jsem se zpětně poohlídla po naší práci, uvědomila jsem si, kolik úsilí za datovým žurnalismem stojí.
Aby datový žurnalista vůbec mohl pracovat, musí si sehnat data. To je asi jeden z nejtěžších kroků, neboť kvalitní, aktuální, veřejně přístupná a o něčem vypovídající data se shánějí těžko.
V lepším případě pak může se získanými daty hned pracovat, ale ve většině případů je potřeba data vyfiltrovat a dočistit.
Pak již zbývá pouze vytvoření vizualizace nebo grafu. Avšak v mém případě jsem měla určitý záměr, ale narazila jsem na to, že daný program nezvládl udělat všechno to, co jsem potřebovala a tak, jak jsem to potřebovala. Musela jsem tedy dělat kompromisy a smířit se s tím, co program dovedl.
Náš poslední projekt se bude zabývat trademarky. Chceme udělat něco podobného tomuto:

zdroj obrázku: http://www.united-academics.org/magazine/homefeat/data-visualization-the-illusion-of-choice/


Coming soon…

Google Fusion Tables a jiné nástroje pro tvorbu grafů

Pro vytváření grafů z kalorické hodnoty sladkých níápojů jsme si skoro každý vybrali odlišné nástroje – někdo infogram, někdo Misrosoft Excel, někdo vytvářel vlastní infografiku ve Photoshopu, někdo si vlastní graf naprogramoval. Já jsem zvolila Google Fusion Tables.

S Google Fusion Tables jsme pracovali i v jedné z následujících hodin. Vložili jsme do něj vyčištěná data z Open Refine a vlastně porovnávali to samé, co na předchozích hodinách, akorát na daleko větším vzorku nápojů.
Zde je vzniklý graf pro půllitrové nápoje seřazené podle množství kalorií:

Google Fusion Table umí nejen vytvářet grafy, ale i pracovat s mapami. Stačí k jednotlivým buňkám zadat název města, adresu nebo GPS lokaci, místo grafu přidat mapu a daná poloha se pak na mapě zobrazí. Navíc lze vytvořit i heatmapu. S mapami lze dále pracovat i v CartoDB  nebo Leaflet.

Obžaloba duševního vlastnictví

Stephan Kinsella je současný americký právník a (anarchistický – jak sám sebe označuje na vlastních webových stránkách) libertariánský teoretik práv.
V článku Obžaloba duševního vlastnictví Kinsella argumentuje proti zastáncům duševního vlastnictví a snaží se dokázat, že duševní vlastnictví jde proti přirozenému ospravedlnění vlastnických práv.
Podle zastánců „má člověk právo na produkty své mysli“, avšak vezmeme-li si například copyright (výlučné právo na kopírování, které chrání originální práce, vzniká automaticky s vytvořením díla a trvá po dobu autorova života + dalších 70 let po jeho smrti), trvání práv dalších 70 let po smrti autora je diskutabilní. Dědici totiž nejsou odpovědní za tvorbu svého předchůdce, a proto takovéto trvání není ospravedlněné. Řada dalších záležitostí v právu na duševní vlastnictví je také značně arbitrární. Například srovnáme-li trvání patentů celkem 20 let oproti copyrightu, který trvá po dobu života autora + 70 let. Navíc, jestliže by měl člověk právo na produkty své mysli, měl by právo na vše, co během svého života vymyslel a vytvořil. Došlo by to však tak daleko, jako v případě Andrewa Josepha Galamba, který „dával stranou niklák pokaždé, když použil slovo „svoboda“ jako poplatek potomkům Thomase Paina, údajného „vynálezce“ slova „svoboda.[1] Takto bychom mohli platit za všechno, co jen vyslovíme, a za všechno, co použijeme, neboť všechny myšlenky a výtvory mají svého prvního autora či vynálezce.
Kinsella však zastává přesně opačný názor. Duševní vlastnictví podle něj ani nemá přirozené ospravedlnění ve vlastnickém zákoně.
Vlastnické právo vzniklo, aby zabraňovalo konfliktu a lidé se nepřeli o vlastnictví jedné věci. Aby vlastnické právo fungovalo, musí být spravedlivé a viditelné. Existuje právo prvního vlastníka. Toto právo je aplikováno na věci, které se vyskytují v omezené míře. Není aplikováno na věci s nekonečnou hojností. „Kdybychom byli v zahradě Eden, kde půda a další statky nekonečně přebývají, neexistovala by vzácnost, a tedy ani potřeba pro vlastnická práva; koncepty vlastnictví by byly bezvýznamné. (…) Vlastnická práva nejsou aplikovatelná na věci s nekonečnou hojností, protože nad takovými věcmi nemůže existovat konflikt. [2]
Právě tento fakt je jedním z jeho největších argumentů proti duševnímu vlastnictví. Jestliže například zkopíruji knihu, nepřipravím původního vlastníka o jeho vlastnictví.
Kinsella navíc tvrdí, že copyrighty a patenty zbytečně zbrzďují rozvoj. „Možná, že by bylo ještě více inovací, pokud by neexistovaly patentové zákony, možná by pro výzkum a vývoj bylo k dispozici více prostředků, kdyby tyto nebyly utráceny za patenty a soudní spory. Je možné, že společnosti by měly mnohem větší motivaci inovovat, pokud by se nemohly spoléhat na svůj téměř dvacetiletý monopol.[3]
Kinsella má jistě v něčem pravdu. Otázka duševního vlastnictví se s rozvojem internetu stala zásadním bodem diskuzí. Copyright je běžně porušován a vznikly alternativní právní úpravy.
Avšak s ohledem na zrušení duševního vlastnictví mě napadají dva největší problémy.  
Zaprvé práva na duševní vlastnictví nelze zcela zrušit. To by znamenalo, že by si kdokoliv mohl přivlastnit cizí dílo a autorství by nebylo podstatné. Musely by se vytvořit  či používat jiné právní formy, jako je třeba Creative Commons. Creative Commons umožňuje autorovi povolit volné šíření díla, pokud je uveden jako autor nebo pokud není dílo použito pro komerční účely či není dále upravováno.
Druhým závažným problémem je pak financování samotných autorů. Volným šířením děl by přišli o zisky a v závěru by se tak celý systém mohl stát kontraproduktivním, neboť by autoři a tvůrci neměli dostatečnou motivaci pro tvorbu děl.
Kinsella si sám tento problém uvědomuje a uvádí seznam možných nápadů, jak mohou autoři ze své tvorby profitovat.
Již například existuje stránka unglue.it, do které má autor možnost nahrát knihu. První čtenáři za ní zaplatí a po dosažení určitého počtu stažení, je kniha volně přístupná ke stažení zdarma. Ostatní čtenáři však také mohou autorovi poděkovat a finančně ho podpořit. Dalšími možnostmi financování je crowdfunding a různé formy mikropříspěvků. 
Zajímavě toto téma pojímá Johanna Blakleykterá  ve své přednášce upozorňuje na fakt, že řada odvětví jako módní průmysl a nábytkářský průmysl není chráněna copyrightem a jejich finanční výnosy jsou daleko vyšší oproti trhu s knihami, filmy a hudbou. Navíc jsou tvůrci v těchto odvětvích nuceni pracovat daleko více kreativněji a neustále reagovat na změny.



[1] KINSELLA, Stephan. Obžaloba duševního vlastnictví [online]. Praha: Ludwig von Mises Institut Česko, 2011, [cit. 2014-08-30]. ISBN 978-809-0506-800. Dostupné z: http://www.mises.cz/database/literatura/30a_obzalobaip.pdf, str. 17.
[2] Ibid., str. 20.
[3] Ibid., str. 15.

Manifest kyborgů

Donna J. Haraway je představitelkou feminismu. Její Manifest kyborgů je ironickým mýtem pro popsání formování ženské identity, ve kterém je použita postava kyborga jako metafory.
Kyborg je spojení stroje a organismu. Toto spojení představuje možnost nerozlišování pohlaví. Takováto bezgenderová podoba kyborga znamená, že kyborg také není utvářen naší kulturou. Ve světě kyborgů neexistuje uspořádání společnosti do rodiny.
Zatímco v našem světě se zdůrazňuje odlišnost muže a ženy a společnost v různých aspektech tuto odlišnost vnímá a řídí se podle ní, ve futuristickém čase kyborgů není na genderové hledisko brán zřetel.
Kyborg stírá hranice mezi člověkěm a strojem, člověkem a zvířetem a fyzickým a nefyzickým. Tyto duality se v pojetí kyborga nerozlišují a dochází tak k jejich zrušení. Ve světě kyborgů jsou si všichni rovni a mají stejné možnosti.


Médium je poselstvím

Marshall McLuhan je jedním z nejznámějších mediálních teoretiků.
Podle McLuhana je účinek média silný a intenzivní právě proto, že jeho obsahem je jiné médium. Například obsahem filmu je román či divadelní hra a obsahem tištěného textu je řeč.
Nestačí tedy studovat obsah daného média, ale je třeba se zaměřit na médium samotné. Často se totiž stává, že obsah média nám zakrývá pravý charakter tohoto média. Programová a obsahová analýza nám tedy neposkytuje klíč k pochopení médií.
Můžeme říci, že povaha médií není ani dobrá ani špatná a že jejich povahu neurčuje způsob, jakým jsou použita. Povaha média je určena jeho formou – „médium je poselstvím.“ Je tedy potřeba pochopit základní principy, aby bylo možné posoudit pravý charakter média.
Technologie ve velké míře mění měřítko a tempo našeho světa. Například knihtisk změnil tempo rozšíření myšlenek a přeorganizoval tak společnost. Elektrická technologie nás podle tohoto autora ohrožuje a toto ohrožení je větší, neboť nepřichází odněkud zvenku, ale zevnitř naší společnosti.
McLuhan argumentuje, že člověk nemůže být svobodný, jestliže nechápe, kam směřuje. V tomto názoru se velice přibližuje názoru Heideggera.

Známé je také McLuhanovo rozlišení na horká a chladná média. Horká média (fotografie, rozhlas, film...) obsahují velké množství informace, zatímco chladná média (telefon, televize [myšlena v dřívější době, dnešní HD televize by byla brána jako horké médium]...) naopak. Horká média umožňují méně participace než chladná a neumožňují tak vcítění.

Otázka techniky

Abychom mohli podle Martina Heideggera pochopit, co je technika, a zjednat si k ní svobodný vztah, nemáme považovat techniku jako prostředek k dosažení určitých našich cílů. Je třeba uchopit techniku duchovně. A jak sám říká, mít techniku pod kontrolou se stává čím dál naléhavější záležitostí.
Technika je jedním ze způsobů odkrývání. Pojem technika je totiž odvozen z řeckého slova techné, které znamená dovednost, ale slovem techné bylo kdysi také označováno krásné umění sloužící k poznání a k odkrývání. Heidegger sám upozorňuje, že takováto definice techniky možná vystihovala řecké myšlení, ale nehodí se k vystižení moderní techniky. A právě v tomto bodě by nás to mělo zneklidňovat.
         Technika sloužila k odkrývání.  Avšak dřívější podoba techniky se od nynější liší. Moderní technika neslouží k odkrývání, ale k vymáhání – vymáhání energie, vymáhání plodin, vymáhání nerostných surovin, …
Tato skutečnost se stává nebezpečím, neboť i člověk, který si neuvědomuje tuto bytnost techniky se sám stává tím, který je vymáhaný. Avšak bytnost techniky  v sobě nese možnou záchranu – a tou je umění (a Heidegger není jediným filozofem, který vidí záchranu člověka v umění). Umění slouží k odkrývání a právě díky němu si můžeme uvědomit pravou povahu techniky.

Kybernetické modelování pohádky

Po vzoru Perníkové chaloupky 2.0 jsme si zkoušeli zpracovat vlastní vizualizaci propojení vět pohádky. Vybrala jsem pohádku o Locice. Komu tento název nic neříká, možná si vybaví její nedávné Disneyovské zpracování s názvem Na vlásku.
Pohádku jsem zjednodušila, přepsala do tabulky a vytvořila si seznam jednotlivých vět, které na sebe navazují.

1. Muž a žena čekali dítě.
2. Žili v domku s malým okénkem.
3. Okénko vedlo do krásné zahrady.
4. Zahrada byla obehnána vysokou zdí.
5. Zahrada patřila zlé čarodějce.
6. Jednoho dne se žena dívala do zahrady.
7. Uviděla záhon plný křehkého locikového salátu.
8. Dostala na něj chuť.
9. Nemyslela na nic jiného než na salát.
10. Hubla a chředla.
11. Muž jí chtěl pomoci.
12. Žena se mu svěřila.
13. Muž v noci přelezl zahradní zeď.
14. Utrhl salát.
15. Žena si pochutnala.
16. Další den dostala ještě větší chuť.
17. Muž se opět vydal pro salát.
18. Přistihla ho zlá čarodějka.
19. Muž jí musel dát své dítě.
20. Čarodějka si dítě odnesla pryč.
21. Dítě pojmenovala Locikou.
22. Čarodějka zavřela Lociku do vysoké věže.
23. Věž neměla žádné schody.
24. Čarodějka Lociku navštěvovala.
25. Locika spouštěla z věže dolů své krásné vlasy.
26. Čarodějka se po nich do věže vyšplhala.
27. Lociku uviděl princ.
28. Zavolal na Lociku.
29. Locika spustila dolů z věže své vlasy.
30. Princ se vyšplhal do věže.
31. Zamiloval se do Lociky.
32. Oba se nemohli dostat dolů.
33. Princ měl do věže nosit kusy provazů.
34. Z provazů chtěl uplést žebřík
35. Princ pravidelně Lociku navštěvoval.
36. Čarodějka se o něm dozvěděla.
37. Čarodějka ustřihla Locice vlasy.
38. Lociku zaklela na poušť.
39. Čarodějka čekala ve věži na prince.
40. Spustila mu dolů ustřižené vlasy.
41. Princ po nich vylezl do věže.
42. Čarodějka princi vyhrožovala.
43. Princ v zoufalosti vyskočil z věže.
44. O trní si vypíchal oči.
45. Slepý putoval světem.
46. Princ došel na poušť.
47. Na poušti žila Locika.
48. Mezitím porodila dvojčata.
49. Princ Lociku po hlase poznal.
50. Locika ho objala a plakala.
51. Její slzy prince vyléčily.
52. Vrátili se do království.
53. Žili šťastně až do smrti.

Nejdříve jsem se potýkala s problémem, v jakém programu vizualizaci zpracovat a tedy v jaké podobě mám zapisovat jednotlivá propojení. Nakonec jsem si vybrala Gephi a po náležitém prozkoumání toho, jak funguje importování tabulky a v jaké podobě musí zápis být, aby Gephi rozeznalo jednotlivé uzly a hrany, se mi podařilo tabulku naimportovat. Zde vidíte výsledek:

Locika

sobota 30. srpna 2014

Simulakrum Jeana Baudrillarda

Klíčovými pojmy pro francouzského postmoderního filozofa Jeana Baudrillarda jsou termíny simulace a simulakrum.
Baudrillard chápe postmoderní dobu jako dobu, ve které jsou lidé ovlivněni simulakry. Simulakrum je něco, co vypadá, že napodobuje reálný předmět, ale co ve skutečnosti už základ v realitě nemá. A právě postmoderní doba je dobou plnou simulaker.
Na produkci simulaker mají z velké části vliv média. Média jsou vmísena do všech oblastí našeho života, že již nejsme schopni oddělit jejich účinky. „Médium samo už není možno jako takové identifikovat...“ Média vytvářejí obraz reality, který však není skutečný.
Společnost se podle tohoto autora stala na simulakrech příliš závislou. Závislou natolik, že už ztratila kontakt s reálným světem. Simulakra se stávají reálnějšími než realita sama. Již nemůžeme mluvit o realitě. Realita se stává hyperrealitou plnou nereálných simulaker.
A co je příkladem těchto nereálných simulaker? Všechny nereálné postavy z filmů a seriálů, na které v každodenním rozhovoru odkazujeme, virtuální úspěchy typu „jsem major na Foursquare“ nebo naše facebookové profily v mnoha případech předstírající, že jsme něco, co nejsme. 

Způsoby světatvorby

Nelson Goodman je jedním z nejvýraznějších představitelů analytické estetiky a filozofie, přesto jsme se jeho Způsoby světatvorby zabývali i na našich hodinách Základů studia nových médií.
Podle Goodmena nemůžeme zachytit svět jako takový. Jediné, co můžeme zachytit, jsou různé verze světa, kterých je velké množství.
Podle Goodmana totiž svět závisí na pojmech a svět tedy vnímáme pomocí pojmů a symbolů. Pojmový aparát může být různý, a proto existují rozličné verze světa, neboť svět třídíme podle pojmového aparátu.
Například svět Eskymáka se liší od našeho světa, neboť rozlišuje několik odstínů bílé barvy. Stejně tak může být tužka jednou vnímaná jako předmět na psaní a podruhé jako shluk atomů. A obrázek na počítači lze vnímat jednou jako zápis v binární soustavě v podobě jedniček a nul a podruhé jako obrázek krajiny. Zároveň jsou všechny varianty světů stejně reálné, nemůžeme říci, že by jedna z variant byla méně reálná než druhá. Rozporné verze světa jsou správné v daném systému, k němuž se vztahují. Záleží na referenčním rámci, ke kterému daný svět vztahujeme.
Každý z nás tak má svůj vlastní svět, protože každý z nás má rozdílné zkušenosti.

Principy nových médií

Kniha Principy nových médií Lva Manoviche je základním kamenem pro obor nových médií.  Není tedy divu, že na hodinách základů studia nových médií jsme se jí nevyhnuli.
Podle Manoviche rozšíření počítačů zapříčinilo převod veškeré mediální produkce do strojově čitelných dat. Výsledkem jsou nová média, pro které je charakteristických 5 principů:
1. číselná reprezentace – dílo je matematicky popsáno a lze s ním snadno manipulovat (například změnit ostrost fotografie)
2. modularita – dílo je složeno z určitých částí (například pixelů, znaků, polygonů). Při úpravě díla lze manipulovat pouze s těmito částmi a nemusím měnit dílo jako celek.
3. automatizace – předchozí dva principy umožnily zatím alespoň částečnou automatizaci některých úkonů.
4. variabilita – první dva principy umožňují, že novomediální dílo není něco pevně daného, ale může být neustále proměňované.
5. překódování – například fotografie je tvořená matematickým popisem rozmístění pixelů a zápisem jejich barvy, ale zároveň ji lze zobrazit jako obrázek.
            Vrátím se však ještě k 4. principu variability. Případy variability jsou:
1. mediální databáze, ve kterých jsou uloženy prvky děl. Příkladem může být databáze obsahující tisíce 3D modelů předmětů či objektů, které si lze stáhnout a použít ve vlastním architektonickém díle.
2. různá rozhraní pro stejný obsah – například dokument mohu upravovat v LibreOffice, Microsoft Office a dalších programech. Základní funkce jsou stejné, ale v některých možnostech úpravy dokumentu se mohou lišit.
3. automatická přizpůsobitelnost uživateli – dnes je řada webových služeb a aplikací přizpůsobena uživateli například i v přesném cílení reklamy, kdy se každému uživateli ukáže reklama jiná.
4. interaktivita větvového typu – uživatel pomocí větvové struktury má možnost si vybrat jak bude pokračovat. Příkladem je průchod jakýmikoliv webovými stránkami.
5. hypermédia – propojení pomocí hyperodkazů
6. pravidelné aktualizace – většina programů umožňuje pravidelné aktualizace, od antivirových programů po informace o počasí v miniaplikacích.
7. stupňovatelnost – generování stejného mediálního díla v různých verzích a různých úrovních detailu – příkladem může být Google Earth, které v největším oddálení zobrazují celou zeměkouli, a v největším detailu modely budov.

Princip variability se také projevuje v slučování několika různých děl – například při vytváření videa mohu použít hudbu a obrázky.

sobota 26. dubna 2014

Čištění dat v Google refine

Podklady pro předchozí úkol, tj. kalorické hodnoty sladkých nápojů, jsem získávala přímo v supermarketu a následně jsem je přenesla do počítače. Sice si mohu být jistá jejich správností, ale byl to příliš zdlouhavý proces. Nyní jsme začali pracovat s již zpracovanými hodnotami získanými z těchto stránek.
Spolužáci z uvedených stránek všechna data vytáhli a my jsme tak dostali rozsáhlou databázi potravin a jejich kalorických hodnot.
Získaná data však ještě nebyla ve stavu, abychom s nimi mohli pracovat. Museli jsme je vyčistit v Google refine. Zde jsou nejdůležitější pokyny jak na to:

Dříve než z otevřeného souboru v Google refine vytvoříme projekt, zadáme Character encoding na UTF-8, tím se nám text bude zobrazovat správně v českém jazyce.
Nepotřebné sloupce odstraníme – Edit columnremove this column.
 

Některé hodnoty máme uváděné v gramech – pro odstranění písmena „g“ – Edit cells transform replace(value," g","").
Následně potřebujeme sjednotit hodnoty, které jsou jinak zapsané, ale ve skutečnosti jsou stejné (například „-“ a „0“). U příslušného sloupce vyberu Facettext facet – v levém okně vyberu hodnotu „-“ u ní vyberu edit a změním na 0.
Změnit čárku mezi čísly na tečku – Edit cellstransform replace(value,",",".")
Převést hodnoty ve sloupcích na číselné hodnoty Edit cellscommon transforms to numbers (čísla se obarví na zeleno).

U sloupce Unit je potřeba sjednotit hodnoty, které jsou stejné – Facettext facetCluster –  zaškrtnu marge v případě, kdy hodnoty vyjadřují to samé. U možnosti Keying Function  můžu vybrat fingerprint nebo ngram-fingerprint. Fingerprint funguje tak, že jednotlivá písmena (či číslice) v názvu jsou seřazena podle abecedy (či podle hodnoty) a tedy názvy, u kterých je toto seřazení stejné, jsou vyhodnoceny jako potenciálně totožné. V ngram-fingerprint jsou hodnoty vyhodnocovány na základě opakovaného sledu po sobě jdoucích slov (či čísel a slov). Můžeme zvýšit Ngram Size, abychom od sebe některé hodnoty rozlišili.

Pro vymazání toho, s čím nechceme dále pracovat (v našem případě vše, co není nealkoholický nápoj) – Facet text facet contains(value,"Nápoje nealkoholické") – dojde k přeměnění hodnot na true a false.
Facettext facet – vyberu vše false a následně to vymažu ve sloupci Alledit rowsremove all matching rows.

neděle 23. března 2014

Běháte půl hodiny denně? Spálíte tím jen džus nebo Coca Colu, kterou jste si dali k obědu

Pro dodržování pravidelného pitného režimu máte vypít 2 až 3 litry tekutin denně. Co během dne vypijete? Džus, kolový nápoj, limonádu nebo ledový čaj? Kalorická hodnota džusů je často vyšší než hodnota kolových nápojů. Ledové čaje jsou na tom jen o něco lépe. Pokud vypijete půllitrovou láhev těchto nápojů, jejich kalorická hodnota je srovnatelná s kalorickou hodnotou čokoládového donutu. Pro spálení takovéto kalorické hodnoty musíte alespoň půl hodiny běhat nebo jít dvě hodiny rychlou chůzí. I půl litru ochucené minerální vody nebo vody s příchutí v sobě obsahuje kalorie, které se spálí až za půl hodiny chůze.
Pokud si hlídáte svou váhu, z nápojů byste měli vybírat ty, které neobsahují žádný cukr.
V následujícím grafu si můžete zjistit, jak dlouho se u vybrané aktivity spaluje daný druh nápoje. Osa y udává počet hodin. Hodnoty jsou uvedeny pro ženu o váze 55 kg.


(Ani s pomocí Google Fusion Tables se mi nepodařilo vytvořit graf tak, jak bych chtěla. Ale alespoň se to mé představě trochu blíží. Druhy nápojů na ose x nejsou seřazeny podle kalorické hodnoty, tudíž ani v grafu nevycházejí rovné přímky. Časovou hodnotu však můžete pro daný druh nápoje vyčíst snadno.)

Deník datového žurnalisty – vizualizace dat

Po důkladném rozebrání mého původního záměru vytvořit sloupcový graf s časem, za který spálím daný druh nápoje, jsem dostala návrh na vylepšení. V grafu by byly zahrnuty kromě běhu i další druhy aktivit jako tanec, jízda na kole atd.
Následně jsem tedy chtěla graf přepracovat, ale narazila jsem na technické potíže. Do tabulky jsem si sice pěkně přehledně všechna data uspořádala, ale když jsem z nich chtěla vytvořit graf, který jsem měla v plánu, základní grafový editor v LibreOffice mi nestačil a podobně to dopadlo i s online nástroji jako je infogr.am.
Podruhé jsem tedy vzala doslova radu, že pro datového žurnalistu je nejdůležitější zápisník a propiska (či tužka a papír), a graf jsem si ručně narýsovala.
Na ose x jsou jednotlivé druhy nápojů seřazené podle kalorické hodnoty – nejvíce má Pfanner, nejméně Ondrášovka. Nápoje s téměř žádnou kalorickou hodnotou (nápoje light) jsem do grafu nezahrnovala. Na osu y jsem vyznačila čas (v hodinách) nutný ke spálení daného nápoje. V jednotlivých přímkách je pak časový údaj o tom, za jak dlouhou dobu daný nápoj spálím při určitém typu aktivity. 


čas, který musíte vynaložit u různých druhů aktivit pro spálení kalorické hodnoty sladkých nápojů
 

Deník datového žurnalisty – psaní článku

K vymyšlenému titulku jsme měli v další hodině datové žurnalistiky doplnit první část textu. Naším úkolem bylo v sesbíraných datech vyhledat nějaký konflikt a snažit se ho následně popsat v několika větách tak, aby byl čtenář přesvědčen, že je třeba daný článek dočíst celý.
Začátek mého článku tedy zní takto:

Běháte půl hodiny denně? Spálíte tím jen džus nebo Coca Colu, kterou jste si dali k obědu.
Pro dodržování pravidelného pitného režimu máte vypít 2 až 3 litry tekutin denně. Co během dne vypijete? Džus, kolový nápoj, limonádu nebo ledový čaj? Kalorická hodnota džusů je často vyšší než hodnota kolových nápojů. Ledové čaje jsou na tom jen o něco lépe. Pokud vypijete půllitrovou láhev těchto nápojů, jejich kalorická hodnota je srovnatelná s kalorickou hodnotou čokoládového donutu. Pro spálení takovéto kalorické hodnoty musíte alespoň půl hodiny běhat nebo jít dvě hodiny rychlou chůzí.

Grafem k tomuto článku měl původně být klasický sloupcový graf s druhem nápoje na ose x a časem, za který spálím daný počet kalorií, na ose y. 

 

Deník datového žurnalisty – vytváření titulku

Víte, že půl litru Coca Coly nebo džusu vás stojí přes hodinu chůze?

Takto zněl můj původní titulek k článku o sladkých nápojích na datovou žurnalistiku. Nakonec jsem ho změnila. Začátek „Víte, že...“ totiž zněl jak z encyklopedie otázek a odpovědí, spojení „půl litru“ také není pro titulek to pravé a doba chůze nikoho moc zajímat nebude. Předělaný titulek zní:

Běháte půl hodiny denně? Spálíte tím jen džus nebo Coca Colu, kterou jste si dali k obědu.

Přiznávám, že tento titulek je poněkud bulvárnější, ale na druhou stranu zaujme více než ten původní. Vlastně jsem si díky tomu uvědomila, že se na těchto hodinách dostáváme na opačnou stranu – na stranu žurnalistů, a stáváme se tedy těmi, které jsme během prvního semestru tak kritizovali.
Zároveň jsem si všimla, že můj postup při sestavování nadpisu také nebyl příliš důsledný a některá fakta jsem záměrně vyzdvihovala, aby lépe vyzněla. Tak například množství vypité Coca Coly uvádím na 0,5l, i když pravděpodobně v restauraci dostanete pouze 3 dl. Avšak u tří decilitrů tohoto nápoje vychází délka běhu na necelou čtvrt hodinu. A čtvrt hodina už vlastně není až tak dlouhá doba.

čtvrtek 20. března 2014

Deník datového žurnalisty – sběr dat

Po první hodině datové žurnalistiky jsme měli za úkol vytvořit seznam co největšího počtu sladkých nápojů a zjistit jejich kalorické hodnoty. Zatímco spolužáci se většinou snažili získat data online cestou, já jsem si vzala k srdci radu, že pro datového žurnalistu je nejdůležitější propiska a zápisník, a vydala jsem se do nejbližšího supermarketu.
Sice jsem mezi regály strávila asi nejdelší čas, co jsem kdy v supermarketu pobyla, ale dat jsem získala hodně. Záměrně jsem vybírala nejrůznější druhy sladkých nápojů – od vod s příchutí až po džusy a limonády.
Vznikla mi následující tabulka:


kalorie na 100 mlkalorie na 0,5lchůze
Pfanner 100%532652,0
Granini502501,9
Mirinda482401,8
Cappy orange462301,7
Relax452251,7
Pfanner nektar432151,6
Coca Cola422101,6
7up422101,6
Pepsi412051,6
Hello nektar402001,5
Fanta371851,4
Bonny tea331651,3
Rio se sníženým obsahem cukru32,5162,51,2
Kofola321601,2
Top drink Aloe vera311551,2
Schwapes301501,1
Lipton ice tea301501,1
Sun Gold ice tea 29,3146,51,1
Sprite291451,1
Aquila team čaj28,5142,51,1
Cappy ice fruit281401,1
Aquila tea27,81391,1
Pfanner Ice tea271351,0
K classic light nektar251250,9
K classic puralis251250,9
Jupík 241200,9
Nestea19950,7
Rauch Nativa18,8940,7
Bon Aqua 17850,6
Magnesia16,582,50,6
Top topic16800,6
Jupí16800,6
Rajec16800,6
Hanácká kyselka12,8640,5
Ondrášovka 10500,4
Kofola bez cukru0,31,50,0
Poděbradka mineral drink0,31,50,0
Toma natura neslazená0,251,250,0
Coca Cola light0,210,0
Coca Cola zero0,210,0
Toma natura plus0,210,0
Poděbradka Pro Linie0,10,50,0


Kalorická hodnota je na obalech uváděna na 100ml. Do tabulky jsem zpočátku uvedla i podíl cukrů, protože jsem původně chtěla porovnávat množství cukrů u různých výrobců džusů či ledových čajů. Nakonec jsem však s touto hodnotou už dále nepracovala. Naopak jsem si zjistila, kolik kalorií člověk spálí při chůzi, a spočítala jsem si čas, za který kalorickou hodnotu daného nápoje spálí (žena o váze 55 kg).

pátek 21. února 2014

Povídání o hafíkovi s micinkou

To bylo kdysi, když hafík a micinka spolu hospodařili; vlastnili u hájku svou malou chatku a tam spolu žili a toužili fungovat tak, jak to konají lidičky. Avšak oni to vždycky tak trochu kazili, vždyť mají pidi tlapičky a nikoliv prsty, jako mají človíčci, a na tlapičkách mají mini polštářky a na nich drápky. A tak byli povinni to vykonávat jinak a nikoliv tak, jak to činí lidičky, a škola byla pro oba tabu, vždyť zvířátka mají vstup do školy zakázán, ba ano, to ano! Co vy na to? Ta bývá totiž pro prcky.
Tak to u nich v obydlí vypadalo kdovíjak. Část zvládli a část nikoliv, a tak tam mívali občas trochu svinčík. A tak si v určitý čas všimli, jak mají nadmíru zapatlanou podlahu chatky...


V tomto bodě s vyprávěním končím, ale pro ty, kdo se při čtení dostali do doby svého dětství a chtějí si Povídání o hafíkovi s micinkou dočíst, je pokračování zde.

A proč toto Povídání o pejskovi a kočičce bez písmena „e“?
To abychom si uvědomili, jak jsme omezeni vyjadřovacími prostředky, které používáme.
Přepsání článku bez písmena „e“ se zdá jako docela lehký úkol. Ve skutečnosti jsem si při psaní uvědomila, že písmeno „e“ je pro češtinu zásadním písmenem. Vytvořit totiž zápor bez jeho použití je dost obtížné.


středa 22. ledna 2014

Tentokrát i o Napoleonovi

V další hodině jsme se bavili o různých druzích grafů a vizualizací. U jakéhokoliv typu vizualizace je třeba se nejprve zamyslet, jakou informaci chceme předat, a podle toho graf vybírat.
Uvedu příklad vizualizace dat očekávaného věku dožití. Je pro nás důležitější informovat o tom, v kterých zemích přesáhly hodnoty určitou věkovou hranici? Nebo informovat o tom, která země je na tom nejlépe? Tyto grafy prezentují stejná data jinak:
Každý z nich má své výhody. V prvním případě je zřetelné, v kterých zemích přesáhl předpokládaný věk dožití 70 let a v kterých zemích je předpokládaný věk velice nízký. Avšak u těchto grafů můžeme jen těžko porovnávat hodnoty jednotlivých zemí mezi sebou. Tato informace je však zřetelná z druhého typu grafu. V něm je také daleko lépe vidět, v kterých zemích nenastala žádná změna či kde se předpokládaný věk dožití dokonce snížil.
Můžeme se také zamyslet, zda neexistuje způsob, jak data prezentovat tak, aby výsledná vizualizace obsahovala co nejvíce informací (avšak současně si zachovala jednoduchost a přehlednost).
Kolik různých informací může vizualizace obsahovat? Dobrým příkladem je Minardova vizualizace Napoleonova pochodu do Moskvy z roku 1869. Přehledně obsahuje:
1) údaje o počtu členů armády
2) údaje o směru pochodu
3) údaje o rozdělení a spojení částí armády
4) geografické údaje
5) teplotní údaje a informace o počasí
6) údaje o délce pochodu
zdroj obrázku: http://en.wikipedia.org/wiki/Charles_Joseph_Minard


Ještě jednou o věku...

Již v předchozím příspěvku jsem se zmínila o nízkém věku moderátorů zpráv u nás oproti zahraničí.
Průměrný věk všech moderátorů zpráv na našich největších televizních stanicích (ČT, Nova, Prima) je 35 let. Z těchto 16 moderátorů je šest ve věku 25-30 a pouze čtyři nad 40 let.
Na Slovensku je průměrný věk moderátorů o něco vyšší – 39 let. Sedm moderátorů je nad 40 let, pouze jedna moderátorka je pod hranicí 30 let.
A jak je tomu tedy v zahraničí? Průměrný věk moderátorů je o něco vyšší. Například na rakouské televizní stanici ORF dosahuje průměrný věk 43 let, ani jeden z moderátorů není mladší 30ti let. Na Švédském SVT dosahuje průměrný věk 47 let, nejstaršímu moderátorovi je 67 let. Ve Velké Británii dosahuje průměrný věk 51 let a v USA 50 let.
Vypozorovali jsme, že věk moderátorů je na západě vyšší a na východě nižší. Průměrný věk moderátorů východních zemí je 38 let, zatímco západních 44 let.
Nyní si můžeme položit otázku, čím to je a co z toho plyne. Při hodině jsme si vytvořili pracovní hypotézu, že důvodem je delší tradice televizního vysílání a odlišná žurnalistická tradice v západních zemích. V těchto zemích je tedy i větší počet zkušených moderátorů. Mladí, začínající nováčci se na tyto pozice dostávají až po letech praxe. Na východě byli naopak moderátoři z dob socialismu vystřídáni především mladšími tvářemi.
Toto je však pouze hypotéza a správnou odpověď zatím neznáme.

pondělí 6. ledna 2014

DIKW pyramida

DIKW pyramida obsahuje čtyři stupně – data, information, knowledge, wisdom (tedy data, informace, znalosti a moudrost)

zdroj obrázku: http://en.wikipedia.org/wiki/File:DIKW-diagram.png


Nejprve se zmíním o datech. Data jsou nějaké základní údaje tvořící základ informace. V informaci jsou data dána do kontextu. Na základě několika informací získáme znalost. Znalost může být tacitní nebo explicitní. Explicitní znalost je taková, kterou lze snadno zaznamenat a předat. Naopak tacitní znalost může být definována jako know-how získané ze zkušeností. Zvyšuje se s věkem. Pro moudrost musíme mít především právě tuto tacitní znalost, až díky ní dokážeme naše znalosti správně uplatňovat.


DIKW pyramidu si nejlépe můžeme přiblížit na příkladu datové žurnalistiky. Řekněme, že máme množství dokumentů obsahujících tisíce různých dat ze zaznamenaných kriminálních případů. Tyto dokumenty jsou pro nás v této fázi nepřehledné. Někdo se jimi však začne zabývat a z dokumentů dokáže vytřídit informace (uplatní svou tacitní znalost). Setříděním a zvizualizováním těchto informací můžeme snadno získat (explicitní) znalost o určitém jevu – dozvíme se například, jaká oblast má nejvyšší a nejnižší kriminalitu a o jaký typ kriminality se jedná. Až díky moudrosti dokážeme pochopit příčiny a důsledky tohoto jevu.


neděle 5. ledna 2014

ImageJ a ImagePlot


Na další hodině Digital Humanities jsme pracovali s programem ImageJ. Je to program vyvinutý společností National Institutes of Health, a tedy původně určen pro vědecké a medicínské výzkumy (to vysvětluje, proč mezi sample images najdete obrázek lidského srdce, rentgeny páteře a fotku NASA zákrutů Nilu). Tento program však má možnost rozšíření o řadu pluginů – my jsme použili ImagePlot Lva Manoviche.
ImagePlot lze použít pro zvizualizování obrazového materiálu podle určitých hodnot – například seřazení obrazů Vincenta van Gogha podle stupně jasu.
obrazy Vincenta van Gogha podle stupně jasu

Dalším programem, se kterým jsme pracovali, je Shotdetect. Jedná se o jednoduchý program, který vygeneruje z filmu počáteční a koncový obrázek jednotlivých scén. Obrázky scén pak tvoří perfektní vizuální materiál právě pro ImageJ.
Na následujícím obrázku můžete vidět zvizualizovaný film Fontána. Na ose x je čas, na ose y jas jednotlivých snímků z filmu. Můžete si tak všimnout, jak postupně celý film přechází do jasnějších barev.
změna jasu v průběhu filmu Fontána

Televizní zpravodajství aneb o frekvenci střihů a věku moderátorů

Na další hodinu srovnávacích mediálních studií jsme měli za úkol sledovat televizní zpravodajství a všímat si počtu zpráv obsahujících násilí, frekvence střihu zpráv, věku, pohlaví a etnika lidí, kterých se reportéři ptají na názor.
Já jsem měla za úkol analyzovat Televizní noviny na Nově ze středy 27.11. Celkově Televizní noviny trvaly 38 minut a obsahovaly 21 reportáží – průměrná délka reportáže byla tedy necelé dvě minuty. Celkový počet střihů ze všech reportáží byl něco okolo 362. Na počítání střihů jsme použili program Cinemetrics, který je určen pro statistiku délky filmových scén. Program za vás zvládne spočítat množství střihů, zatímco vy při sledování jen mačkáte mezerník.
Sledovat frekvenci střihů reportáží je poměrně zajímavé. Doteď jsem si neuvědomila, jak moc se některé reportáže svým počtem střihů blíží akčním filmům. O tom jsme se také přesvědčili na přednášce, kdy jsme si pouštěli reportáže z roku 2010 o střelci z Devínské Nové Vsi. Muž tehdy zabil sedm lidí, dalších několik postřelil a pak spáchal sebevraždu. Zpráva se objevila na všech televizních kanálech, dokonce i zahraničních. Co nás na jednotlivých reportážích z dané události také zaujalo, byla právě frekvence střihů. Reportáž z TV Nova by opravdu akčním filmům mohla klidně konkurovat.
Vrátím se zpět k analýze Televizních novin – zpráva obsahující násilí se vyskytla pouze jedna, a to o vraždě Češky v Indii. Věk komentujících se pohyboval nejvíce okolo 50 let, u žen dosahoval přibližně 35 let. Osoby nad 60 let se objevily pouze tři, z toho jeden muž a dvě ženy. Všichni komentující byli běloši, pouze v jedné zahraniční reportáži se objevili dva Hispánci.
Věk komentujících nás vedl k tomu, abychom také zkoumali věk moderátorů zpráv. Zatímco v komentářích se na všech televizních kanálech pohybuje věk dotazovaných kolem 30 – 50 let, věk moderátorů zpráv je čím dál tím nižší. Oproti zahraničním televizním zprávám, kde nejsou výjimkou moderátoři starší 50 let, se věk našich moderátorů pohybuje okolo 35 let.