Қатысушы талқылауы:AlefZet/LanguageKk kz.php

Бұл бет туралы көбірек білу

Уикидеңгейі:

увидел знакомую проблему: спряжение казахских слов. тоже ломал голову, уж слишком много исключений :)) заметил след.:

ілік септік: -ның/-нің: не согласен на счет слов, заканчивающихся на у, и, ю(?): қарудың, мидың

т.е. к константе $sonantStems добавить ещё и и и ю (у в списке уже есть)?

- думаю, стоит проверять сперва на -дың/-дің, затем на -ның/-нің

какая разница? ведь это же elseif

- учтены ли случаи спряжения местоимений: менің, сенің, оның (~~меннің, сеннің, олдың~~);

никак, ведь grammar применяется не ко всякому слову, а тому которое извлекается из переменной, а переменную выдает MediaWiki.

барыс: в каком случае присоединяются окончания -на/-не? если в случае, как с жұмыс+ы+на, то программа выдаст ~~жұмыс+ы+ға~~

тут надо как-то выделить тауелдік жалғау, не получится из-за обилия слов с такой же финалью (жалко, что казахский кодифицировал не эсперантист :)). к сожалению, к притяжательным никак не применимо :(

- опять же местоимения: маған, саған, оған (~~менге, сенге, олға~~)
табыс: -ны/-ні: ми+ды (~~ми+ны~~), қару+ды (~~қару+ны~~)

если считать буквы и и у только сонантами, никаких подводных камней не вылезет?

- когда используется -н?: если в жұмыс+ы+н, то выдаст ~~жұмыс+ы+ны~~
опять же местоимения: мені, сені, оны (~~менні, сенні, олды~~)
жатыс: тоже самое, что и в табыс септік;
шығыс: похоже, что у тебя после согласных ж,з не рассматриваются для -дан/-ден, т.е. подпадают под -нан/-нен: жаз+дан (~~жаз+нан~~)

похоже, таблицы не совсем верные?

көмектес: местоимения: менімен, сенімен, онымен (~~менмен, сенмен, олмен~~)

если чем могу быть полезен, то буду рад помочь GaiJin 15:25, 26 қыркүйек 2006 (UTC)

Для других языков grammar реализован ещё примитивнее. Кроме тувинского, см. для примера, основной код я заимствовал отсюда. Тағы қараңыз http://svn.wikimedia.org/viewvc/mediawiki/trunk/phase3/languages/ --AlefZet^т 18:48, 26 қыркүйек 2006 (UTC)

ввёл формы possessive--AlefZet^т 15:25, 28 қыркүйек 2006 (UTC)

извини, тәуелдік жалғау не проверял. у меня вопрос, откуда взялась буква "ý"? у Қайдара ее нет, насколько я помню. GaiJin 04:31, 29 қыркүйек 2006 (UTC)

У Қайдара много чего не было. :) Букву «Ý» пришлось ввести для однозначной взаимно-обратной автоматической транслитерации «Й», также как и «Ï» (вообще-то я предлагал ҚазАқпарату букву «Î» для кириллической «И» в традициях турецкой латиницы - крышечка обозначает долгие гласные, а «И», как дифтонг, можно представить как своего рода долгий, тогда как точечки обозначают гласные переднего ряда, «мягкие»). --AlefZet^т 08:23, 29 қыркүйек 2006 (UTC)

я помню, что вначале буквы Ï не было, а было сочитание Iy. но теперь, когда есть и Ï и Y, о какой неодназначности идет речь? можно хотя бы один пример? GaiJin 05:57, 30 қыркүйек 2006 (UTC)

Да любые сочетания Й + гласный: если yo -> ё, ya -> я, yu -> ю, то дәйексөз -> däyeksöz -> дәексөз, майор -> mayor -> маёр, Нью-Йорк -> Nʹyu-York -> Нью-Ёрк и т.д.; если yo -> йо, ya -> йа, yu -> йұ, то жою -> joyu -> жойұ, жаяу -> jayaw -> жайау. Кстати, опять же для однозначности, а также для правильной работы функции grammar надо бы транслитерировать так: Ю -> YW (ведь по правилам й+у -> ю), а не как Ю -> YU --AlefZet^т 08:51, 30 қыркүйек 2006 (UTC)

это на практике получаестя? если верить мануалю пхп, функция strtr() will always look for the longest possible match first. GaiJin 11:02, 30 қыркүйек 2006 (UTC)

Да, так и получается. Причём, от языка программирования никак не зависит. Только от правил транслитерации и инвентаря используемых символов.--AlefZet^т 22:39, 30 қыркүйек 2006 (UTC)

понял. а в каком алфавите будут сохраняться тексты? и в каком редактироваться? GaiJin 10:47, 30 қыркүйек 2006 (UTC)

Это конвенциональный вопрос, т.е. ИМХО «в каком алфавите статья написана, в таком и должна редактироваться» (в кириллице и латинице), пользователь же сможет прочитать по своему усмотрению в одном из трёх алфавитов, включая арабицу. Дефолтным считается кириллица. Пользователь сможет по свему усмотрению в своих настройках может выбирать предпочтительный вариант алфавита в котором будет обычно читать. Помимо этого он может в любой момент посмотреть статью в любом алфавите. Как это работает можно сейчас посмотреть на примереsr: и zh:. В окошке редактирования текст показывается в том алфавите, в котором хранится в базе. Однако, пользователь сможет перекодировать (с помощью Викификатора в режиме транслитератора) избранный кусок текста в кириллицу или латиницу, а затем произвести редактирование, с условием, что он вернет кодировку к изначальной. Арабица исключается из процесса редактирования, поскольку полноценная реализация транслитерации из арабицы в латиницу или кириллицу практически невозможна, хотя бы из-за неразличения строчных и прописных букв. Попытка же использовать алгоритм аналогичный уордовскому только поганит результирующий текст. По крайней мере, другого выхода я не вижу.--AlefZet^т 22:39, 30 қыркүйек 2006 (UTC)

sondiktan

Қатысушы:AlefZet/LanguageKk kz.php жайында талқылау бастау

Талқылау беттерін Уикипедия сайтындағы контент барынша ең жақсы жасау үшін адамдар талқылауға қолданады. Бұл талқылау беттін Қатысушы:AlefZet/LanguageKk kz.php бетін қалай жетілдіру туралы басқалармен талқылауды бастау үшін қолдана аласыз.

Талқылау бастау

Тақырып қосу