Een paar weken geleden las ik iets over een algoritme dat sarcasme in geschreven teksten zou kunnen herkennen. Razend interessant, want dat is zelfs iets dat mensen niet altijd kunnen (zie: elke onterechte ruzie op het internet). Als (semi-, ex-) computationeel linguist wil ik natuurlijk wel eens weten hoe zo’n algoritme dan in elkaar zit. Bij nader onderzoek blijkt de paper in kwestie al een jaar oud te zijn, maar dat mag in principe de pret niet drukken.
Wat wél de pret mag drukken zijn de voorbeelden die worden genoemd in het artikel. Deze voorbeeldzin wordt in het artikel aangemerkt als sarcastisch:
Horrible tripe of a novel, i Lost IQ points reading it
Dit systeem is eigenlijk wel zo makkelijk
Ben ik nou gek? Snap ik sarcasme niet? Bij sarcasme zeg je het tegenovergestelde van wat je bedoelt en tenzij de schrijver van deze zin eigenlijk heel positief is over het boek in kwestie, lijkt het me toch dat hij hier gewoon zeer direct zijn negatieve mening ventileert. En op basis van incorrecte voorbeelden kun je niet op geloofwaardige wijze een algoritme presenteren.
Mijn conclusie luidt dus als volgt: ja hoor, echt een fantástische uitvinding, die sarcasme-analysator. En als menselijke lezer kunt u dus snappen dat ik dat bedoel als Anti-tip van de Dag.