Massadatan standardisointi Jari Salo asiantuntija, TIEKE 2.6.2015
Massadatan standardisointi
Jari Salo asiantuntija, TIEKE
2.6.2015
Aiheet
Massadatan standardisointiryhmä
Viitekehys ja tehtävänasetanta
Työalueet
Ensimmäisen kokouksen tulokset
Jatkotyö ja kokousaikataulu
3.6.2015 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 2
Massadatan standardisointiryhmä
ISO/IEC JTC 1/SG 2/WG9 - Big Data
ISO/IEC JTC 1/SG 2/WG9 - Big Data järjesti ensimmäisen kokouksensa Bremenissä , Jacobs Universityn isännöimänä.
Big Data on hyväksytty uudeksi projektiksi komitean alaisuuteen. Big Data projekti sai tunnuksen ISO/IEC NP 20546.
Kokoukseen osallistui 24 edustajaa eri maista: Irlanti, Japani, Kiina, Korea, Saksa, Suomi, UK ja USA.
Suurimmat delegaatiot olivat USA:lla, Kiinalla ja Korealla.
Työryhmän koollekutsuja (Convenor) Wo Chang, NIST, USA.
3.6.2015 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 4
Viitekehys ja tehtävänasetanta
Big Data työryhmän toiminnan määrittely (ToR)
Keskeinen toimija JTC 1:n Big Data standardisointiohjelmassa.
Laatii perustavat standardit Big Datalle - Big Data yleiskatsaus ja sanasto (Overview and Vocabulary)
Viitearkkitehtuuri (Reference Achtechture)
JTC 1:n työn ohjaamiseksi ja muiden Big Data standardien kehittämiseksi.
Kehittää muita perusstandardeihin pohjautuvia Big Data standardeja, jos sopivia JTC 1 alaryhmiä, jotka voivat käsitellä näitä standardeja, ei ole tai eivät pysty niitä kehittämään.
Tunnistaa puutteet Big Data-standardoinnissa.
3.6.2015 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 6
Toiminnan määrittely (jatkoa)
Kehittää ja ylläpitää yhteyksiä kaikkien asianomaisten JTC 1:n yksiköiden ja työryhmien kanssa, joka voivat ehdottaa Big Dataan liittyviä työkohteita tulevaisuudessa.
Tunnistaa JTC 1:n (ja muiden organisaatioiden) yksiköt, jotka kehittävät standardeja ja niihin liittyvää materiaalia sekä edistävät Big Dataa sekä tarvittaessa selvittää käynnissä olevat ja mahdolliset uudet työkohteet, joka voivat vaikuttaa Big Datan kehittämiseen.
Luoda suhteita JTC 1:n ulkopuolella toimivien yhteisöjen kanssa, tietoisuuden lisäämiseksi, sitouttamiseksi ja yhteyksien muodostamiseksi JTC 1 Big Data-standardointiin.
3.6.2015 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 7
Työalueet
Big Data - Overview and Vocabulary
Big Data - Overview and Vocabulary (ISO/IEC 20546)
Tavoitteena on laatia kansainvälinen standardi joka sisältää yleiskuvaksen Big Datasta sekä siihen liittyviä termejä ja määrittelyjä.
Standardi muodostaa terminologisen pohjan kaikille Big Dataan liittyville standardeille.
Projektin editoriksi valittiin Nancy Grady, NACS (US) ja co-editoriksi Lili Yang, Huawei (CH).
Projektin kesto 36 kk.
3.6.2015 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 9
Big Data viitearkkitehtuuri Big Data Reference Achitecture - BDRA (ISO/IEC 20547)
Tavoitteena on määritellä Big Data viitearkkitehtuuri, joka sisältää: roolit,
toiminnot ja
toiminnalliset komponentit suhteineen ja riippuvuuksineen.
Projektin editoriksi valittiin Sunwook Ha, (KR) ja co-editoreiksi David Boyd (US) ja Ian Walshe (IR).
Projektin kesto 36 kk.
3.6.2015 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 10
Ensimmäisen kokouksen tulokset
Tuloksia
Kummankin projektin osalta editorit valmistelevat työryhmän luonnoksen jaetaan kommenteille verkkotyötilaan (livelink)
työryhmän jäsenet kommentoivat luonnosta 23. kesäkuuta asti
editori laatii päivitetyn version seuraavaan kokoukseen.
Laadittiin luonnos sisällysluetteloksi ”Big Data - Overview and Vocabulary” dokumenttiin. Laadittiin sisällysluetteloa ”Big Data Reference Architecture” dokumenttiin sekä keskusteltiin etenemisestä ja työmenetelmästä.
Käytiin läpi editorien ensimmäiset luonnokset ”Overview and Vocabulary” ja ”Reference Architechture” dokumenteista.
3.6.2015 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 12
Tuloksia
Nimettiin yhdyshenkilöt muihin standardointiryhmiin, raportoivat Big Data työn etenemisestä heille nimetyissä työryhmissä.
Yhdyshenkilöiksi nimettiin:
Ray Walshe ISO/IEC JTC 1/SC38 ja
Jörn Barthels ISO/IEC JTC 1/SC32.
Päätettiin lähettää tiedote WG 9 Big Data työn aloittamisesta mm. JTC 1:n sisäisille komiteoille ja työryhmille: ITU-T SG 13,
OASIS,
W3C,
Open Geospatial Consortium (OGC),
Transaction Processing Performance Council (TPC), TM Forum.
3.6.2015 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 13
Jatkotyö ja kokousaikataulu
Projektien tuotoksille ja etenemiselle asetettiin aikatauluksi: Työluonnos, marraskuu 2015
Komitealuonnos, maaliskuu 2016
Standardiluonnos marraskuu 2016
Kansainvälinen standardi maaliskuu 2017
Seuraava kokous Koreassa 7.-9. heinäkuuta 2015 2015 marraskuu Brasilia, Brasilia 2016 kevät Espanja 2016 kesä Peking, Kiina 2016 loka/marras Marrakesh, Marokko 2017 kevät Japani
3.6.2015 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 15
Suomessa – Big data Forum Finland BiFF
Foorumi jalkauttaa LVM:n Big data –strategiaa käytäntöön LVM rahoittanut foorumin perustamisvaihetta
Foorumi on avoin ja riippumaton
Foorumi toimii tiiviissä yhteistyössä ja vuorovaikutuksessa Finnish Industrial Internet Forumin (FIIF) kanssa
Haaste: Alan käsitteistö ja määritelmät ovat edelleen sekavia ja ristiriitaisia Ns. ´datatietoisuus´on heikko
Julkinen keskustelu ja big datan täysimääräinen hyödyntäminen edellyttävät yleistiedon tuottamista ja levittämistä
3.6.2015 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 16
Big data buzz
Ihmisten ja tietoverkkoihin kytkettyjen laitteiden ja antureiden tuottaman tiedon määrä kasvaa hyvin nopeasti. High Volume, high Velocity & high Variety of sources
Datan arvo laskee nopeasti, jos sitä ei hyödynnetä.
Uusi tekniikka mahdollistaa hyvin suurten tietomäärien varastoimisen ja analysoinnin murto-osalla aiemmista kustannuksista. Haasteena tiedon pirstaloituminen ja heikko laatu (puutteelliset määrittelyt,
epäyhdenmukaiset tiedon esitysmuodot, puuttuva metadata)
Itseään koskevan tiedon hallitseminen, my data
Big Data tarkoittaa näiden tietovarantojen reaaliaikaista analysointia ja hyödyntämistä uusissa kuluttajille ja teollisuudelle tarjottavissa palvelutuotteissa
toiminnan ohjaamiseksi reaaliaikaisesti tai automaattisesti.
BiFF törmäyttää substanssi- ja big data -osaamisen
3.6.2015 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 18
BiFF Substanssi - tietovarat
- tarpeet
Big Data - tiedonhallinta
- analyysi
Koulutus - tarpeet - sisällöt
Tutkimus - kysymys - väline
Innovaatiot - tuotteet - palvelut
Tiedolla johtaminen - real time economy - toimintatavat
Tieke
Teollisuus
Kunnat
Ministeriöt
Yliopistot
Konsultit Tutkimuslaitokset
Mahdollisuuksia ja haasteita
Uudet palvelut ja tuotteet Kuluttajille suunnatut palvelut, esim. terveystieto- ja elämäntapapalvelut, älykäs
sähköverkko ja älykäs asuminen
Investointituotteiden muuttuminen tietointensiivisiksi palveluiksi, esim. hissit, koneet, automaatiojärjestelmät
Teollisuuden palvelut, esim. ennakoiva logistiikka
Tiedolla johtaminen Liiketoiminnan tai julkishallinnon reaaliaikainen ohjaus (real time economy)
Haasteena tunnistaa, mitä datalta halutaan kysyä (esim. visualisoimalla dataa)
Big datan haasteet Tietoturva ja yksityisyyden suoja kun kaikesta ja kaikista kerätään tietoa
Päätöksenteon läpinäkyvyyden katoaminen numeronmurskauksen taakse
Datan laadun varmentaminen: Bad data in, terrible information out.
Virheitä voivat aiheuttaa tahattomat virheet analysoitavissa tiedoissa tai analyysialgoritmeissa tai tietojen tai algoritmien tahallinen manipulointi
3.6.2015 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 19
TIEKE Tietoyhteiskunnan kehittämiskeskus ry
TIEKE on v. 1981 perustettu tietoyhteiskunnan puolueeton ja riippumaton vaikuttaja, verkottaja ja vauhdittaja.
TIEKEn toiminnan painopisteet ovat 1. Tieto- ja viestintätekniikan osaamisen kehittäminen
2. Sähköisten toimintaprosessien edistäminen
3. Tietoyhteiskunnan tietopalvelut
TIEKEn toimintatapoja ovat hankkeet, foorumit, palvelut, seminaarit ja yhteiskunnallinen vaikuttaminen.
TIEKEn jäsenenä on yli 80 julkista ja yksityistä organisaatiota Jäsenmaksu liikevaihdon perusteella 3 500 €, 1 700 € tai 800 €
TIEKEn liikevaihto on n. 1,3 milj. € vuodessa TIEKEssä työskentelee 12 henkilöä
2013 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 20