Vuosi 2020

Tekstinlouhinta työpaikkailmoituksista

Edit 02/2022: MOL on muuttanut APIaan, joten olen kytkenyt toistaiseksi kaikki päivitykset pois. Katsotaan, jaksanko palata tämän ääreen jossain vaiheessa.

ITDuunit-sivusto raapii päivittäin uudet it-alan työpaikat TE-keskuksen palvelusta ja ylläpitää listaa auki olevien paikkojen edellyttämistä osaamisista. Tällä hetkellä systeemi parsii ilmoitusteksteistä hakijoilta edellytettyjä teknologiataitoja ja näyttää, mitä teknologioita juuri nyt pitäisi osata.

Tekniikat: Webbisivusto: Flask ja Plotly. NLP-työkaluna NLTK.

NLP News analysis website


NLP ja tekstinlouhinta uutisaineistoista

Tein uutisanalytiikkaa jutuista, jotka käsittelevät sekä Ilmastonmuutosta että Greta Thunbergia. Kyseessä on sovellus, joka raapii uutissivustoilta uutisia, puhdistaa ne ja käyttää erilaisia NLP-tekniikoita uutisten analysoimiseksi. Käytössä on yksinkertaista sanojen yleisyyden laskentaa, sentimenttianalyysiä, nimien tunnistamista ja aihemallinnusta (LDA).

Tekniikat: Web: Flask ja Plotly. Analyysityökaluina mm. NLTK, Scikit-learn, NewsAPI, Vader jne.
Lähdekoodi:: githubissa
Demoserveri: frostlab.fi/nlpnews

NLP News analysis website


Vuosi 2019

Menomeno event calendar API browser

Webbisovellus, joka hyödyntää Menomeno RESTful APIa (kts. alla).

Tekniikat: ReactJS, Bootstrap 4
Koodi: Githubissa


Menomeno backend & RESTful API

Oulusta, ja ehkä muistakin kaupungeista, puuttuu edelleen tapahtumakalenteri, joka pysyisi ajan tasalla. Tavoitteena on tehdä sellainen. Projekti on vielä työn alla, mutta toimiva, testattu backend ja dokumentoitu REST API on nyt tehty.

Tekniikat: Flask, Flask-RESTful, Python (paikallinen admin: Javascript, JQuery)
Koodi: Githubissa
API dokumentaatio: Apiaryssä

Menomeno API


Uutistutka

Oulun yliopiston projektissa tekemäni tiedonlouhintasovellus, jossa analysoidaan verkon ilmastonmuutosuutisia. Uutiset haetaan avoimien rajapintojen kautta, puhdistetaan tekstiksi, analysoidaan eri tekniikoita käyttäen ja raportoidaan webbiin.

Tekniikat: Django, Python, NLTK, PostgreSQL, Nginx
Verkossa: – poistettu julkisesta verkosta 19.12.2021 –

Analysis at Uutistutka


ArticleWeb

Oulun yliopiston projektissa tekemäni tiedonlouhintasovellus, jossa puretaan tietellisistä artikkeleista lähdeviitetietoja ja analysoidaan, kuka viittaa kehenkin, mihin journaaleihin ja milloin. Tämän osaksi kehitelty myös articleparse-työkalua, jolla saataisiin pdf-tiedostot purettua järkevästi analysoitavaksi tekstiksi.

Tekniikat: Django, Python, PostgreSQL, Nginx, articleparse
Verkossa: – poistettu julkisesta verkosta 19.12.2021 –

ArticleWeb at Uutistutka


Vuosi 2017

Hypernote Beast

Käyttöliittymäohjelmoinnin kurssille tehty työ, jossa testasin, miten tehdä käyttöliittymältään mahdollisimman pieni muistiinpano-ohjelma, joka muuttuisi “isoksi” ohjelmaksi hyperteksti-ominaisuuksien avulla.

Tekniikat: Java, Swing
Koodi: githubissa

Hypernote Beast


Vinkka.news

Vinkka.newsin suunnittelu- ja ylläpitotehtävät vuodesta 2008 vuoteen 2020. Nykyinen on jo aika mones versio alkuperäisestä. Wordpressistä lähdettiin liikkeelle, josta Drupalin ja Joomlan testailujen kautta takaisin Wordpressiin. Palvelun vaatimuksena on, että sen pitää olla järkevästi ylläpidettävä, taipua moniin julkaisutarkoituksiin (mm. radio- ja podcast-projektien julkaisu) sekä olla opiskelijoille ja henkilökunnalle helposti opittava. Pohjalla Wordpress. Logo ja graafinen ilme henkilökunnan ja opiskelijoiden yhteistyötä.

Vinkkamedia


Vuosi n. 1993-1994

PC-Atoms

Pelasin teini-ikäisenä kaverin Amiga 500 -koneella kovaa peliä nimeltä Atoms. Itsellä oli vain PC ja peliä ei ollut saatavilla PC:lle, joten tein sen itse. Ei kovin kaunis, mutta toimiva ja ihan ok strategiapeli, jota tuli tahkottua kaveria vastaan aika tavalla. Alkuperäinen toteutus oli Turbo Pascalilla ja jollain sille julkaistulla grafiikkakirjastolla. Toimii DOS-ympäristössä ja edelleen emulaattorin kautta. Lähdekoodit ovat kadonneet, joka ei välttämättä ole valitettava asia.

PC-Atoms

Muuta mainittavaa

  • VDR-pohjaisia linux-digibokseja olen rakentanut omiin ja muiden tarpeisiin. Näissä on opittu paljon linuxeista, sarjaporteista, tv-virittimistä, bash-skriptauksesta, saksankielisistä teknisistä ohjeistuksista, avoimen lähdekoodin olemuksesta ja DVB-tekstitykseen liittyvän idealismin ongelmista.
  • Omat Python-projektit pyörivät Ubuntu-virtuaaliservereillä Vultrissa. AWSää testattu myös, mutta Vultr osoittautui omiin tarpeisiin yksinkertaisemmaksi ja riittäväksi. NLP-analyysiprojekti pyörii halvassa webhotellissa (kohtuullisesti!) Apache WSGI-modia hyödyntäen.
  • Wordpress-projektit ovat PHP-webhotelleissa.
  • Linux-taidot ovat kohtuullisen hyvät. Tutuimmat Linuxit ovat Debian-pohjaisia.