Википедија:Масовни унос/фудбалери
Из пројекта Википедија
Ово је координациона страна везана за масовни унос фудбалера.
Садржај |
[уреди] Мишљења и идеје
[уреди] Подаци
Подаци су са различитих сајтова фудбалских архива. Из комбинације два таква се могу постићи резултати приказани као на примјерима. Први је примјер типичних фудбалских података који се могу генерисати. Други је примјер компликованог бившег фудбалера који је сада тренер. Наравно то ће од алгоритма да направи "алгоритмчину" али, "ко није покушао, није ни успио".
[уреди] Релевантност
Пошто се укупан број расположивих података креће негдје око 25.000, а обим материјала по једном играчу је (још) на граници довољног, требало би одредити критеријуме релевантности, који би се уградили у сам алгоритам и број евтл. чланака снизио на нпр. око 10.000. Дакле нешто као "само репрезентативци", "са више од два играчка успјеха (титуле)" и сл.
[уреди] Потребно вријеме
[уреди] Генерисање излазних података
Пошто подаци треба тек да се генеришу, мислим да би "технички подаци" могли бити спремни за мануелну дораду за неке двије седмице.
[уреди] Мануелна дорада
- Подјела на мање дијелове.
- Транскрипција, преводи и сл. (директно у XML бази података).
- Контрола
[уреди] Унос
- Тест
- Продуктивни унос
[уреди] Ресурси
- Мрежне локације извора ће бити наведене као у примјерима, евентуално допуњене другим изворима који би се користили при мануелној доради.
[уреди] База података
База изворних и мануелно прерађених података ће бити у XML формату. Слиједи радна верзија истог.
<?xml version="1.0" encoding="UTF-8" ?>
<fudbaleri>
<fudbaler>
<licniPodaci>
<orginal><![CDATA[Amado Guevara]]></orginal>
<srpski>Амадо Гевара</srpski>
<visina>-</visina>
<tezina>75</tezina>
<pozicija>средина терена</pozicija>
<noga>-</noga>
<rodjen>
<dan>2</dan>
<mjesec nr="5">мај</mjesec>
<godina>1976</godina>
<mjesto>
<orginal><![CDATA[Tegucigalpa]]></orginal>
<srpski>Тегусигалпа</srpski>
</mjesto>
<drzava>Хондурас</drzava>
<drzavljanstvo>Хондурас</drzavljanstvo>
</rodjen>
</licniPodaci>
<karijera>
<igrac>
<klub>
<orginal><![CDATA[CD Chivas]]></orginal>
<srpski>ЦД Чивас</srpski>
<ugovor>
<od>1/2007</od>
<do>12/2007</do>
</ugovor>
<referenca><![CDATA[http://www.weltfussball.de/teams.php?m_id=5674&modus=2]]></referenca>
</klub>
<klub>
<orginal><![CDATA[New York Red Bulls]]></orginal>
<srpski>Њујорк Ред Булс</srpski>
<ugovor>
<od>1/2003</od>
<do>12/2006</do>
</ugovor>
<referenca><![CDATA[http://www.weltfussball.de/teams.php?m_id=2271]]></referenca>
</klub>
<klub>
<orginal><![CDATA[Real Valladolid]]></orginal>
<srpski>Реал Валадолид</srpski>
<ugovor>
<od>7/1995</od>
<do>6/1996</do>
</ugovor>
<referenca><![CDATA[http://www.weltfussball.de/teams.php?m_id=524]]></referenca>
</klub>
</igrac>
<reprezentativac>
<drzava srpski="Хондурас" brojUtakmica="13">
<godina>2006</godina>
<godina>2001</godina>
<godina>2003</godina>
</drzava>
</reprezentativac>
</karijera>
<referenca><![CDATA[http://www.weltfussball.de/spieler_profil.php?id=27020&modus=1]]></referenca>
</fudbaler>
... itd. ...
</fudbaleri>
[уреди] Пример
Примјери су: Мартин Демикелис и Амадо Гевара
[уреди] Критика
Сарадња и конструктивна критика је добродошла! --Kaster 00:29, 27. март 2007. (CEST)
- Не знам да ли је ово место за расправу, али ево мог питања. Да ли је предвиђена могућност периодичног аутоматског апдејтовања? Да не завршимо са 10k чланака који ће бити тотално неажурни. -- Обрадовић Горан (разговор) 01:27, 3. април 2007. (CEST)
- Уколико извори допусте (буду актуелни), планира се актуелизовање а и проширивање чланака из других извора. Иначе, већ имам податке за око 5000 играча. Видјећу ноћас да завршим остатак па да се крене на мануелни дио посла (транскрипцију имена и мјеста рођења играча као и имена клубова). --Kaster 04:17, 3. април 2007. (CEST)
-
- Коначан број је: 18000. --Kaster 09:09, 3. април 2007. (CEST)

