משתמש:רנדום/פרויקט כלי ויקי

מתוך ויקיפדיה, האנציקלופדיה החופשית

ClayWiki הוא פרויקט לפיתוח כלי תוכנה פתוחים וחופשיים לויקיפדיה. הפרויקט יספק ספריות פיתוח ב-Java לטיפול בהיבטים שונים של ויקיפדיה, כלי שורת-פקודה ויישומים מוגמרים שונים. דף הבית של הפרויקט הוא כאן.

[עריכה] תוכנית הפיתוח

[עריכה] תשתיות בסיסיות

  • ספריה לטיפול בקבצי Dump של ויקיפדיה. קבצים אלה הם קבצי XML גדולים (מאות MB ומעלה) ולא ניתן לטפל בהם בשיטה נאיבית של טעינה מקדמית לזיכרון. הספריה תאפשר טיפול יעיל בכל גודל של קובץ בשיטת SAX באמצעות Apache Commons Digester ו-JAXB. הספריה תאפשר שליפה יעילה של דפים העונים לקריטריון מסוים (באמצעות ביטויים רגולריים) והעברתם לתוכניות אחרות להמשך טיפול.
  • מיפוי הדקדוק של ויקיפדיה ב-JavaCC.