Podstawą zakwalifikowania źródłowego artykułu do takiej lub innej kategorii jest występowanie w nim określonych fraz, sformułowań, nazw własnych i innych konstrukcji językowych. Na podstawie natężenia takich elementów w tekście określamy dziedzinę artykułu (np. motoryzacja, gry komputerowe, przestępstwa z użyciem noża itd.) i jego wymowę (np. rozstania celebrytów).
Z jakich elementów składa się model analityczny
Ogólnie rzecz biorąc, nasze modele analityczne składają się z części twardej, obejmującej dane słownikowe, oraz miękkiej, czyli fraz i sformułowań typowych dla samego języka polskiego.
dane słownikowe
nazwiska
W większości modeli mamy podział na Polaków i obcokrajowców. Przykładowe słowniki:
- politycy
- sportowcy (z podziałem na dyscypliny)
- muzycy
- aktorzy i inne osoby związane z przemysłem filmowym
- znani specjaliści w różnych dziedzinach (np. lekarze wypowiadający się w mediach)
- osoby zajmujące wysokie stanowiska w różnych branżach (np. kierownictwo policji)
- znani mordercy z całego świata (również ich pseudonimy, obcokrajowcy z podziałem na kontynenty, a w Europie na kraje)
nazwy własne
- nazwy firm
- nazwy klubów sportowych
- nazwy leków (z podziałem na typy dolegliwości, np. osobno Remeron i Molnupiravir)
- tytuły filmów i seriali z podziałem na gatunki (np. filmy z Jamesem Bondem)
- nazwy znanych zespołów muzycznych
- nazwy imprez regionalnych z powiatów w całej Polsce
- nazwy broni i technologii wojskowych (z podziałem na wykorzystujące je państwa)
- modele dronów
- marki i modele samochodów
słownictwo branżowe
Dla wielu branż w wersji formalnej i potocznej. Przykładowe słowniki:
- pojęcia z Kodeksu karnego (np. klasyfikacja przestępstw)
- pojęcia z Kodeksu postępowania karnego (np. związane ze składaniem i wiarygodnością zeznań)
- pojęcia związane ze służbą w formacjach mundurowych
- pojęcia związane z giełdą, obrotem aktywami finansowymi i analizą techniczną
- pojęcia związane z opieką i wychowaniem dzieci (z podziałem na wiek)
słownictwo i frazy stosowane w artykułach z różnych dziedzin
O ile dane słownikowe pozwalają wychwycić z tekstu, jakich osób, firm, narzędzi itp. on dotyczy, o tyle bardziej ogólne sformułowania (np. "pod wpływem") pozwalają "skleić" pojedyncze zidentyfikowane obiekty w większą całość o zrozumieć sens artykułu. Składają się na nie:
- frazy ogólne, wskazujące na czynności opisywane w artykule
- frazy wskazujące na przekaz emocjonalny (np. makabryczny [wypadek], tuż za [podium])
Przykładowo, zupełnie innego języka używa się w artykułach:
- motoryzacyjnych (np. o nowych samochodach), oraz opisach wypadków samochodowych - mimo że obie dziedziny dotyczą samochodów
- o rozstaniach i kryzysach w związkach celebrytów, oraz o ich udziale w różnego rodzaju konkursach, reality show i innych programach telewizyjnych - mimo że jedno i drugie może dotyczyć dokładnie tych samych osób
- pisanych językiem formalnym, językiem jakiejś mniejszości narodowej (np. Śląsk, Kresy), slangiem, albo językiem mającym na celu wywrzeć określony odbiór emocjonalny jakiegoś tematu (np. artykuły o Islamie często pisane są w taki sposób, aby wywrzeć na czytelniku wrażenie, że Islam jako taki jest czymś wyłącznie złym)
- pisanych przez osoby o różnym światopoglądzie bądź doświadczeniach życiowych (np. o kwestiach prywatności, wolności i inwigilacji przez służby, inaczej będzie pisał policjant, inaczej dziennikarz OKO.press czy Panoptykonu, a jeszcze inaczej pseudokibic czy były więzień)