Annexe 1 Liste d'une partie des ressources lexicales
Voici une liste des ressources lexicales informatisées, téléchargeables et gratuites, trouvées sur Internet.
Nom |
Brève description |
Nbr d'entrées |
Langues |
URL |
Apertium |
218 dictionnaires monolingues en 93 langues différentes, 236 dictionnaires bilingues en 235 couples de langues différents |
Plus de 3,8M pour dictionnaires
monolingues. Plus de 2,5M pour dictionnaires
bilingues |
http://wiki.apertium.org/wiki/List_of_dictionaries https://sourceforge.net/projects/apertium/files/ |
|
CC-Cedict |
Un dictionnaire de zho→eng. |
114K |
zho→eng |
https://www.mdbg.net/chindict/chindict.php?page=cedict |
CFDICT |
Un dictionnaire de zho↔fra |
6240 |
zho↔fra |
http://www.chine-informations.com/mandarin/open/CFDICT/ |
DELAF |
Lexique des formes fléchies du
français et de l'anglais. |
Dictionnaire du français :
683K entrées simples pour 102K lemmes différents et 108K entrées composées
pour 83K lemmes différents. Dictionnaire de l'anglais :
296K entrées simples pour 150K lemmes différents et 133K entrées composées
pour 70K lemmes différents |
eng, fra |
http://infolingu.univ-mlv.fr/DonneesLinguistiques/Dictionnaires/telechargement.html |
DiLAF |
Base lexicale contributive
conllaborative pour les dictionnaires de langues africaines vers le français. |
bam : 10 800 hau : 7238 kan : 6000 thm : 6100 dje : 6914 |
bam→fra, hau→fra, kan→fra, thm→fra, dje→fra |
http://www.dilaf.org/dilaf/Home.po |
GLÀFF |
Un lexique du français à large
couverture extrait du Wiktionnaire, le dictionnaire collaboratif en ligne |
2M |
fra |
http://redac.univ-tlse2.fr/lexiques/glaff.html |
IATE |
Une grande base terminologique. |
8M |
25 langues européennes |
http://iate.europa.eu/tbxPageDownload.do |
Jibiki.fr
|
Base lexicale contributive
collaborative pour dictionnaire fra-jpn. Trois ressources
disponibles : Cesselin, JMdict, Kanjdic |
153 897 |
jpn, fra, eng |
http://jibiki.fr/data/ |
JMdict |
Dictionnaire japonais-anglais et autres langues par Jim Breen |
173K |
jpn→ eng,fra,esp, por,deu,rus, nld |
http://www.edrdg.org/jmdict/j_jmdict.html |
Kaifangcidian |
Quatre
dictionnaires : zho→nor, nor→zho, zho→epo, epo→zho |
zho→nor :
2544 nor→zho :
3469 zho→epo :
6313 epo→zho :
5492 |
zho↔nor, zho↔epo |
http://kaifangcidian.com/xiazai/nuo/ http://kaifangcidian.com/xiazai/shi/ |
LEFFF |
Lexique des formes fléchies du
français. |
Nombre de formes : 404 634 Nombre de lemmes : 105 595 |
fra |
http://www.labri.fr/perso/clement/lefff/ |
Littré |
Dictionnaire monolingue français |
136K |
fra |
http://www.littre.org/faq |
Morphalou |
Lexique des formes fléchies du
français. |
Nombre de formes : 524 725 Nombre de lemmes : 95 810 |
fra |
http://www.cnrtl.fr/lexiques/morphalou/ |
MotÀMot |
Base lexicale contributive
conllaborative pour un dictionnaire fra↔khm. |
13 249 articles français avec
traductions en khmer. 23 766 articles khmer avec
traductions en français. 32 402 liens bilingues français-khmer. |
fra↔khm |
http://jibiki.univ-savoie.fr/motamot/Download.po;jsessionid=ivcrZwUlAQHW-L9LomhO0jJN |
ProLMF |
Ressource de Prolexbase. Lexique relationnel multilingue de
noms propres |
Nombre de pivots : 73 365 Nombre de relations : 72 604 (3
908 accessibilités, 67 417 méronymies et 1 279 synonymies) Nombre d'entrées lexicales en
français : 96 800 (75 501 noms propres et 21 299 dérivés, soit 147 518
formes) Nombre d'entrées lexicales en
anglais : 19 449 (19 355 noms propres et 94 dérivés, soit 19 449 formes) Nombre d'entrées lexicales en
polonais : 39 020 (35 937 noms propres et 3 083 dérivés, soit 165 309 formes) |
10 langues (principalement fra,
eng, pol) |
http://www.cnrtl.fr/lexiques/prolex/ |
WaDoku |
Dictionnaire japonais-allemand par Ulrich Apel |
280K |
jpn→deu |
http://www.wadoku.de/wiki/display/WAD/Downloads+und+Links |
Webster's |
Dictionnaire monolingue anglais Webster's de 1913 |
182 700 |
eng |
http://www.gutenberg.org/ebooks/29765 |
Wiktionary |
Le dictionnaire multilingue
contributif le plus connu au monde. |
4 683 963 |
Plus de 100 langues |
http://dumps.wikimedia.org/backup-index.html |
WordNet |
Grande base de données lexicale pour l'anglais. |
147 278 |
eng |
https://wordnet.princeton.edu/wordnet/download/current-version/ |
Annexe 2 Exemple de diversité des UW dans le projet UNL (1 p.)
Exemple du mot "access" dans différents dictionnaires d'UW.
U++C |
access(icl>recover>do,
agt>thing, obj>thing); Cat : VERB; Déf . : obtain or retrieve from a storage device; as of information on a
computer; access(icl>reach>do,
agt>thing, obj>thing); Cat. : VERB; Déf. : reach or gain access to; Ex. : "How does one access the attic in this house?"; "I cannot get to the T.V. antenna, even if I climb on the
roof"; |
UNLKB |
right(icl>abstract thing)
access(icl>right) way(icl>abstract thing) abandon(icl>way) access(icl>way) opportunity(icl>time) access(icl>opportunity) market(icl>opportunity) enter(agt>person,obj>thing) access(icl>enter(agt>person,obj>thing)) barge
in(agt>person,obj>thing) open(agt>thing,obj>thing) access(icl>open(agt>thing,obj>thing)) reach(agt>thing,obj>thing) access(icl>reach(agt>thing,obj>thing) use(agt>thing,obj>thing) access(icl>use(agt>thing,obj>thing))
build(icl>use(agt>thing,obj>thing)) drive(icl>use(agt>thing,obj>thing)) |
UNLDeco/UNL-FR |
[accéder] {CAT(CATV),AUX(AVOIR),VAL1(GN),GP1(A)} "access(agt>thing,obj>thing)"; |
EOLSS/UNL-FR |
access(icl>use(agt>thing,obj>thing)) |
Annexe 3 Historique du projet Papillon (1 p.)
(Ce qui suit est un résumé par Ch. Boitet de diverses présentations).
Le projet Papillon [Tomokiyo, M. et al., 2000] a été lancé en juillet 2000 par Emmanuel Planas, François Brown de Colstoun et Mutsuko Tomokiyo[1], avec le concours de F. Andrès, U. Apel, V. Bellynck, Ch. Boitet, J. Breen, M. Mangeot, G. Sérasset, M. Zock, K. Kageura, M. Lafourcade, etc. La motivation principale du projet était qu'il y a très peu de ressources dictionnairiques français↔japonais, et que ces ressources ne sont pas informatisées. Les dictionnaires disponibles sous forme papier sont chers et difficiles à utiliser par les apprenants, à cause du manque de transcription phonétique et d'autres informations cruciales pour les étrangers, comme les classificateurs et quantificateurs. Le but du projet était de créer un environnement de développement coopératif à travers Internet et de créer une grande base lexicale multilingue. Il s'agissait initialement du français, du japonais et de l'anglais.
Les premières années du projet, de 2000 à 2006, il y eut un séminaire par an. Le séminaire de lancement du projet Papillon eut lieu en août 2000 au NII, à Tokyo. Il fut décidé de développer non pas une, mais deux bases lexicales multilingues, Papillon-CDM et Papillon-NADIA, décrites au I.1.3.2.3. Le second séminaire (juillet 2001, Grenoble) fut surtout consacré à des décisions techniques et organisationnelles, au vu du fonctionnement durant la première année. Le séminaire de 2002 fut organisé en juillet à Tokyo. Il y fut décidé que toutes les ressources de ce projet seraient mises en "source ouvert" (open source), sous licence Creative Commons. On discuta aussi des ressources financières et des façons de construire la base. En juillet 2003, le séminaire fut accolé à ACL-2003, à Sapporo. On y discuta de la plate-forme logicielle utilisée pour la construction de la base lexicale. Le séminaire de 2004 fut organisé en août à Grenoble sous la forme d'un post-workshop (Multilingual Linguistic Ressources, MLR2004) de COLING-2004, qui avait lieu à Genève. En 2005, le séminaire fut organisé en décembre à Chiang Rai, Thailande. Le dernier eut lieu en juillet 2006 à Bangkok, en liaison avec celui du STIC-Asie-NLP, juste avant COLING-2006.
Depuis 2006, la base lexicale est maintenue en service par M. Mangeot et est utilisée pour de la consultation, et de temps en temps pour de la contribution. Contrairement aux attentes initiales, il n'y a pas de contributions "isolées" par des contributeurs opportunistes. Par contre, quand quelqu'un ou un groupe a produit un dictionnaire intéressant, il lui est facile de le faire intégrer la base.
Il faut en particulier noter le projet GDEF (Grand Dictionnaire Estonien Français) [Mangeot, M. & Chalvin, A., 2006], supporté depuis plus de 10 ans par une instance particulière de Papillon. Un petit groupe de Français et d'Estoniens y travaille tous les jours.
Annexe 4 Questions et réponses sur HowNet[2] (18 p.)
Ce qui suit est tiré d'échanges passionnants avec le Pr. Dong Zhen Dong (en chinois), qui a créé et continue à augmenter HowNet avec quelques collaborateurs, depuis 1988.
Aupararant, il avait participé au projet KY-1, un système TA zh↔en, développé par l'académie des sciences militaires entre 1982 et 1987. En 1988, ce système a été renommé TRANSTAR, le premier système commercial de TA en Chine [Dong, D. Z., 1990 ; Dong, D. Z., 2007].
1. Is HowNet a WordNet-like lexical
database?
No. HowNet is not a WordNet-like lexical database. HowNet is completely
different from WordNet both in its philosophy and implementation. WordNet is an
online lexical database, while HowNet is a common-sense knowledge system with
concepts as its basis. HowNet is purely computer-oriented.
2. What is HowNet most prominent
feature?
HowNet most prominent feature is its unique way to define the concepts
denoted by the lexical units in its basic database.
For example,
In HowNet: |
cf. WordNet: |
buy 1.
DEF={buy|买} 2.
DEF={GiveAsGift|赠:manner={guilty|有罪},purpose={entice|勾引}} |
buy 1.
(594) buy, purchase –
(obtain by purchase; acquire by means of a financial transaction;) 2.
(7) bribe, corrupt,
buy, grease one's palms – (make illegal payments to in exchange for favors or
influence;) |
Buyer 1.
{human|人:domain={commerce|商业},{buy|买:agent={~}}} |
Buyer 1.
buyer, purchaser,
emptor, vendee – (a person who buys) |
HowNet concepts or senses are defined in a structured language called
Knowledge Data Mark-up Language (KDML), which is composed of two basic elements
and a set of symbols as its operators.
sememes: buy|买, GiveAsGift|赠, guilty|有罪, entice|勾引, human|人, commerce|商业 ... semantic relations:
manner, purpose, domain, agent... operators: {}, =, :, ~
... |
3. What is the current size of
HowNet basic database?
Current general statistics are as follows (25/01/2016) :
Chinese characters |
20 892 |
20 892 |
Chinese words &
expressions |
122 078 |
125 022 |
English words &
expressions |
111 945 |
116 641 |
Chinese meanings |
138 957 |
142 485 |
English meanings |
132 369 |
137 566 |
Definition |
32 137 |
33 268 |
Record |
220 790 |
226 860 |
4. Then what is the current size in
terms of syntactic and semantic categories?
Syntax
|
|
Semantics |
||||
PartOfSpeech |
English |
Chinese |
|
PartOfSpeech |
English |
Chinese |
adj |
12 599 |
13 721 |
|
Entity |
4 |
3 |
adv |
3 122 |
2 433 |
|
Event |
14 799 |
15 558 |
aux |
101 |
103 |
|
Attribute |
5 201 |
4 665 |
char(acter) |
0 |
14 405 |
|
AttributeValue |
10 967 |
10 860 |
classifier |
0 |
447 |
|
Thing |
94 579 |
94 593 |
conj |
85 |
135 |
|
Time |
2 872 |
2 872 |
coor |
7 |
14 |
|
Space |
1 427 |
1 427 |
det |
123 |
58 |
|
Component |
9 208 |
9 209 |
echo |
7 |
137 |
|
|
|
|
expr(ession) |
1 000 |
850 |
|
|
|
|
infs |
7 |
0 |
|
|
|
|
letter |
57 |
57 |
|
|
|
|
noun |
66 823 |
61 712 |
|
|
|
|
num(eral) |
572 |
557 |
|
|
|
|
pp |
1 372 |
0 |
|
|
|
|
prefix |
28 |
7 |
|
|
|
|
prep |
320 |
257 |
|
|
|
|
pron |
109 |
176 |
|
|
|
|
pun |
50 |
45 |
|
|
|
|
root |
3 233 |
0 |
|
|
|
|
stru |
0 |
82 |
|
|
|
|
suffix |
7 |
0 |
|
|
|
|
verb |
27 415 |
32 620 |
|
|
|
|
wh |
87 |
48 |
|
|
|
|
Categories:
木,林,树,梨,桃,李,森,枝,茶,杈,栋,梁,檩
医院,医生,医药,医师,医士,医患,医德,医闹,医疗,医术
5. What does a RECORD look like in
HowNet basic database?
As described in Q3, HowNet currently includes over 220 000 records in
its database. In HowNet each word or expression is written in the form of a
record. A record is composed of the following items:
NO.= |
serial number |
W_C= |
Chinese word or expression |
G_C= |
Chinese grammatical
information |
S_C= |
Sentiment information for
Chinese |
E_C= |
Examples for Chinese |
W_E= |
English word or expression |
G_E= |
English grammatical
information |
S_E= |
Sentiment information for
English |
E_E= |
Examples for English |
DEF= |
Definition of the concept |
RMK= |
Remarks |
Some records are shown below.
NO.=047395 W_C=动脉硬化症 G_C=noun [dong4 mai4 ying4 hua4 zheng4] S_C=MinusEntity|负面实体 E_C= W_E=atherosclerosis G_E=noun [2 atherosclerosisnoun-0static,uncount] S_E=MinusEntity|负面实体 E_E= DEF={disease|疾病:scope={part|部件:PartPosition={nerve|络},whole={part|部件:PartPosition={viscera|脏},whole={AnimalHuman|动物},{circulate|循环:instrument={~}}}}} RMK=Atherosclerosis comes from the Greek words
athero (meaning gruel or paste) and sclerosis (hardness). |
NO.=162300 W_C=问 G_C=verb [wen4] S_C= E_C= W_E=ask G_E=verb [2 askverb-0vt,dobj,sobj,whobj,ofnpa22 ] S_E= E_E= DEF={ask|问} RMK= |
NO.=128941 W_C=请求 G_C=verb [qing3 qiu2] S_C= E_C= W_E=ask G_E=verb [3
askverb-0vt,sobj,tocomp,thatobj,ofnpa23
] S_E= E_E= DEF={request|要求} RMK= (Note the
difference between two "ask" in their grammatical information) |
NO.=142804 W_C=适销对路 G_C=adj [shi4 xiao1 dui4 lu4] S_C=PlusSentiment|正面评价 E_C= W_E=salable G_E=adj [3 salableadj-0endmore,prepo1 ] S_E=PlusSentiment|正面评价 E_E= DEF={suitable|适宜:domain={commerce|商业},scope={sell|卖:possession={$}}} RMK= |
6. If I search with some semantic
feature(s), can I extract all the words with the specified feature(s) from
HowNet? If I can, how should I do?
Yes, you can. Look at HowNet Browser and you will find the following
dialogue boxes which function with the search: KeyWord, Language, and search
Mode at the Browser bottom line, the selection result may be shown as follows:
exact, first, fuzzy, etc.
Take the English word "patient" for example.
Input the word "patient" into KeyWord and choose "exact" for search mode.
KeyWord:
patient Language:
Automatic exact |
Then choose the first sense:
DEF={human|人:domain={medical|医},{SufferFrom|罹患:experiencer={~}},
{doctor|医治:patient={~}}}
Then choose the whole DEF as a semantic feature and input it, and select
"first" as search mode.
KeyWord: "{human|人:domain={medical|医},{SufferFrom|罹患:experiencer={~}},
{doctor|医治:patient={~}}}" Language: feature
first |
Then the Browser will show the statistical results at the right-hand
corner: 8 DEF(s) found and 52 record(s) found.
Now take {SufferFrom|罹患:experiencer={~}} as value of the KeyWord, and fuzzy
as search mode.
KeyWord: "{SufferFrom|罹患:experiencer={~}}"
Language: feature fuzzy |
Then the Browser will also show the statistical results at the
right-hand corner: 23 DEF(s) found and 80 record(s) found.
If we want to extract and export all the records of the search results,
we place the cursor at the result box and right-click. We then see a menu,
choose "Export Search Result(full)", and "Export Search Result(Chinese words)" or "Export Search Result(English Words)".
Some of the 80 records of the search results are exported and shown
below.
NO.=140765 W_C=失语症患者 G_C=noun [shi1 yu3 zheng4 huan4 zhe3] S_C=MinusEntity|负面实体 E_C= W_E=aphasic G_E=noun [2 aphasicnoun-0static个 ] S_E=MinusEntity|负面实体 E_E= DEF={human|人:{SufferFrom|罹患:content={disease|疾病:scope={speak|说}},experiencer={~}}} RMK= |
NO.=120276 W_C=陪床 G_C=verb [pei2 chuang2] S_C= E_C= W_E=stay in a hospital ward to look after a patient G_E=verb [51stayverb-0vi ] S_E= E_E= DEF={stay|停留:location={room|房间:domain={medical|医},{doctor|医治:location={~}}},purpose={TakeCare|照料:patient={human|人:domain={medical|医},{SufferFrom|罹患:experiencer={~}},{doctor|医治:patient={~}}}}} RMK= |
NO.=201564 W_C=主诉 G_C=noun [zhu3 su4] S_C= E_C= W_E=chief complaint G_E=noun [52complaintnoun-0 ] S_E= E_E= DEF={text|语文:RelateTo={human|人:domain={medical|医}, {SufferFrom|罹患:experiencer={~}}, {doctor|医治:patient={~}}}, {ExpressDissatisfaction|示不满:instrument={~}}} RMK= |
NO.=181525 W_C=医嘱 G_C=noun [yi1 zhu3] S_C= E_C= W_E=doctor's advice G_E=noun [52advicenoun-0 ] S_E= E_E= DEF={text|语文:domain={medical|医}, {propose|提出:agent={human|人:{doctor|医治:agent={~}}},content={~}, target={human|人:{SufferFrom|罹患:experiencer={~}}}}} RMK= |
NO.=040849 W_C=担架 G_C=noun [dan1 jia4] S_C= E_C= W_E=stretcher G_E=noun [2 stretchernoun-0static付 ] S_E= E_E= DEF={tool|用具:domain={medical|医},
{transport|运送:instrument={~},
patient={human|人:domain={medical|医},{SufferFrom|罹患: experiencer={~}},{doctor|医治:patient={~}}}
{human|人:{wounded|受伤:experiencer={~}}}}} RMK= |
NO.=151072 W_C=探病 G_C=verb [tan4 bing4] S_C= E_C= W_E=visit a patient G_E=noun [51visitverb-0vi ] S_E= E_E= DEF={visit|看望:content={human|人:domain={medical|医},{SufferFrom|罹患:experiencer={~}},{doctor|医治:patient={~}}}} RMK= |
7. Are you developing any
HowNet-based machine translation systems?
Yes, we have recently built a HowNet-based English-to-Chinese MT system,
named HowNet MT. The system is a rule-based and semantic-enhanced system. As
the system employs much common-sense knowledge and semantics, its translation
quality is incredibly good, much better than the free MT systems on the web.
The system is composed of three parts: HowNet Knowledge-base, English syntactic
and semantic analysis subsystem, and Chinese synthesis subsystem. The English
analysis subsystem can be used on its own as an English parser to meet other
NLP demands.
8. What is the HowNet-based tool
called Sense_Colony_Tester and what tasks can it be applied to?
Each kind of bacteria has its own colony based on the same morphology.
Similarly, each concept has its own colony. HowNet-based Sense_Colony_Tester
(SCT) can represent and thus display the relevancy of a concept, or sense, to
the other concepts in a given context.
SCT is bilingual, English or Chinese. Let's look at the following demo. Suppose
your text to be tested is:
“I usually have bread and butter and homemade jam for breakfast.”
After you input your text into the "Source Text" Box, and select English or Chinese
and then click "submit".
Figure 92 : HowNet Interface 1 |
In the "Result Tree" box, all the concepts or senses of
the given text will be shown. We call this processing a text-CT, as shown by Fig.
2. If only words rather than concepts or senses can be displayed, it is called
text-X-ray as shown by Figure
92.
Figure 93 : HowNet Interface 2 |
SCT critical function is to give two statistical results: (1) Relevancy
Count for every concept of the words in the tested text; (2) Distance Value of
every concept from its immediate relevant neighbour.
Figure 94 : HowNet Interface 3 |
Therefore, SCT can be applied to WSD, especially for those types of
discourse ambiguities. SCT is employed in the HowNet-based machine translation
system. Figure
94 shows SCT will choose the sense of "eat" for the word "have", cf. Figure
95 And Figure
96 shows SCT will choose the sense of "food" for the word "jam", cf. Figure
97. The relevancy count of the sense of food in
the word "jam" is 0004, which is the highest of
its three senses. We suppose you may know what senses are the voters for this: "eat", "drink" of the word "have", and "food" of "bread and butter" and "eat" in the word "breakfast".
Figure 95 : HowNet Interface 4 |
SCT can also serve as an effective tool for tasks based on meaning
computation, such as text summarization, text topic identification, text
categorization, etc. Figure
98, Figure
99 and Figure
100 show that the topic of the given text may be
some kind of medicine and its relatedness to a symptom and infection, the
statistical results of the concepts, the following concepts enjoy higher
priority in Relevancy Count (more than 0010).
Medicine: |
0024 (0025) |
Treat: |
0017 |
Symptom: |
0024 |
Infection: |
0018 |
Cell: |
0024 |
Fungus: |
0012 |
Skin: |
0022 |
Cell membrane: |
0012 |
9. I have a question on English; I
think a native speaker will answer it. My questions are:
What are the correct or accurate
English questions for the following statements:
(1) I kicked him in/on the
leg. – "Where did you kick him?" It seems inaccurate.
(2) He signed his name at
the right lower corner. "Where did he sign his name?" It
also seems inaccurate.
In Chinese there are two different
kinds of questions which we can distinguish:
你在哪踢了他?(Where did you kick him?) – in the playground
你把他哪踢了?(You kicked him where?) – in the leg
他在哪签了他的名字?(Where did he sign his name?) – in the office
他把名字签在哪了?(He signed his name where?) – at the right lower corner
Or in English the questions of the
kind are ambiguous themselves.
Our friend Thomas Yale answered my questions as follows.
To answer your question, this is another way English is more ambiguous
than Chinese.
(1) For the question "Where did you kick him?" the answer
"I kicked him in/on the leg" seems the most reasonable in one's mind
in English, but it could be answered with a particular place: "I kicked
him in my apartment."
(2) The same case for "Where did he sign his name?" The
most reasonable contextual answer in English is "He signed his name at the
right lower corner (of the document)" but could also be answered "He
signed his name at the law office" or even "He signed his name in
Quebec", although we would regard both the latter geographical places as
one being within another, and the anatomical place, which is a body part, can
move and be anywhere.
Consider this significance, however. It appears that the verb in
the question implies the kind of place that is to be understood. Compare
"Where did you kick him?" which implies which body part, with
"Where did you take him?" which implies a geographical place.
Because, you see, the definitions (DEFs) in HowNet that "kick"
is defined with the single sememe "kick", and "take" (the
definition that applies with the above sentence, one translation I think is
dai4 ru4) is defined as "guide". Significantly, the two words
are in different places in the Event taxonomy: "kick" is listed under
"AlterForm" / "AlterAppearance" /
"AlterAttribute" and "guide" is listed under
"CauseToDo" / "MakeAct".
So perhaps this is the key to solving this problem of translation: the
fact that they do occupy different places in the taxonomy is the basis to
deduce what kind of place (anatomical, geographical, or maybe other kinds of
places) expected from the answer is most reasonable, or is anticipated in the
answer.
From your examples it appears that Chinese avoids this ambiguity in its
syntax, by placing interrogative pronouns (like "where", perhaps
others?) in a different place among the words in the sentence:
· 你在哪踢了他? ("Where you kick+past him?")
as opposed to "You kicked him where?"
· The same with他在哪签了他的名字?("Where he sign+past his name?") as opposed
"He signed his name where?"
10. What are the features specified
for English words in HowNet Dictionary? [features total 135]
Apart from POS, the following features are specified and allotted in the
five domains of each English word or MWE in the square brackets. Here they are.
1. 1st domain – word structural information
The numbers represent: [7]
[1+(space)+single word token ("1" – most
high-frequency sense) |
[2+(space)+single word token ("2" – more
high-frequency sense |
[3+(space)+single word token ("3"– general
high-frequency sense) |
[7+(space)+single word token ("7" –
never-chosen for E-C MT |
[4+(1~10/11/12...)+head of MWE ("4" – most
high-frequency sense) |
[5+(1~10/11/12...)+head of MWE ("5" –
general frequency sense |
[6+(1~10/11/12...)+head of MWE ("6" –
never-chosen for E-C MT |
(1~10/11/12...)
represents the place of the head in the MWE |
2. 2nd domain – POS information [17]
noun |
pron |
verb |
adj |
adv |
num |
det – determiner (the) |
aux – auxiliary verb (be, have, do, can, may…) |
wh – wh-words (who, when, as, though) |
conj – coordinate conjunctions |
prep – prepositions (in, for, according to, on
behalf of…) |
pp – preposition phrase (on bad terms…) |
infs – infinitive sign (to, in order to, so as to) |
expr – an expression, syntactically independent |
echo – a sound |
prefix |
suffix |
3. 3rd domain – Word-ending
information: [11]
-0 //normal
word -s (children)
// special plural -0s (police)
// no plural or invariable plural -v (wrote) //
special past form -ed (bought) //special -ed (past) -en (written) //special -en (past participle form) -ing (feeling, meeting) -ings -aaa (put) //strong
verb with 3 same forms: present – past – past participle -aba(come-came-come) // present = past participle -aab (beat-beat-beaten) //present = past |
4. 4th domain – syntactic
information [4]
neg – negative (no, none…) |
present – present time |
past – past time |
future – future time |
4.1 Word/MWE form information:
[6]
fup – first letter in upper-case |
aup – all letters in upper-case |
acro – acronym |
endthat – MWE ending in "that" (it is said
that, |
endprep – MWE ending in a preposition (be confident
in, rely on…) |
endto – MWE ending in an infinitive-to (be
determined to) |
4.2 for nouns: [9]
action – action noun |
ofnpa – in "action-noun + X": X normally
as its patient |
ofnag – in "action-noun + X": X normally
as its agent |
static – static noun |
uncount – uncountable noun |
unit – a unit (meter, foot, gram…) |
proper – a proper noun (Canada, Tokyo, Obama, IBM…) |
nomodinoun – almost never used to modify a noun
(means) |
moneysign – a moneysign ($,¥..) |
4.3 for numerals [19]
ordi – ordinal (first, 2nd, tenth…) |
card – cardinal (1, two, million…) |
predet – can come before determiners (all, both,
either, none of) |
singular – singular (1) |
plural – plural (2,10,100…) |
indef – indefinite amount (some) |
demo – demonstrative (this, those) |
date – indicates
"date" (1- 31) |
hour – indicates
"hour" (1- 24) |
minute – indicates
"minute" (1 - 60) |
bage – indicates
"baby's age" (1 - 3) |
tage – indicates
"troddler's age" (4 - 5) |
cage – indicates
"child's age" (6 - 9) |
tnage – indicates
"teenager's age" (10 - 15) |
yage – indicates
"youth" (16 - 41) |
mage – indicates
"middle-age" (42 - 69) |
oage—indicates
"old age" (70 -112) |
1digit – indicates one-digit number (1, 2, 3… 9) |
2digit – indicates two-digit number (10, 11, 12… 99) |
3digit – indicates three-digit number (100, 101, 110…
999) |
4digit – indicates four-digit number (1000, 1001, 1110…
1999) |
4.4 for pronouns [5]
accusat – accusative case (him) |
nominat – nominative case (we) |
reflex – reflexive (oneself) |
singular – singular |
plural – plural |
4.5 for verbs:[15]
vt – transitive |
vi – intransitive |
copula – copula |
linkall – copula which can take n/adj/ved/ven as its
complement (be) |
linkadj – copula which can take adj/ved/ven as its
complement (get) |
sobj – can take a single obj (destroy) |
dobj – can take a double obj (give) |
ingobj – can take a Ving obj (start, keep, stop…) |
thatobj – can take a that-clause as its obj (say) |
whobj – can take a wh-clause as its obj (ask) |
toobj – can take an to-infinitive-verb as its obj
(want) |
nouncomp – can take a noun as its complement (call) |
tocomp – can take an to-infinitive-verb as its
complement (ask) |
adjcomp – can take an adj as its complement (paint) |
ingcomp – can take a ving as its complement (keep) |
4.6 for adjectives: [5]
ender – for adj/adv takes "-er" ending
when in comparative |
endmore – for adj/adv takes more" when in
comparative |
prepo – usually comes before the element it modifies |
postpo – usually comes after the element it modifies |
infmodi – often followed by an infinitive phrase
(difficult, eager…) |
4.7 for adverbs: [7]
ender – for adj/adv takes "-er" ending
when in comparative |
endmore – for adj/adv takes more" when in
comparative |
minf – can be used to modify infinitives (merely,
just…) |
mnum – can be used to modify numerals (only, about,
just…) |
madjonly – can only be used to modify adjectives |
sentent – usually used as a sentential adverb (it be
said that) |
nomverb – never used to modify verbs to its left
(more than) |
4.8 for conjunctions: [3]
conjand – conjuction "and" |
conjbut – conjunction "but" |
conjor – conjunction "or"/'nor' |
4.9 for infinitive sign: [TM/2]
infw – single word (to) |
infp – MWE (in order to, ready to, so as to…) |
4.10 for auxiliaries: [6]
auxdo
auxiliary "do" |
auxheve
auxiliary "have" |
auxbe
auxiliary "be" |
modal modal
auxiliaries (can, may, should, would rather…) |
tense tense
auxiliaries (will, would, shall, should) |
quasiaux quasi-auxiliaries (may just as well, be
more likely to) |
4.11 for wh-words: [7]
question – can be used as a question-word (who,
which,why…) |
objclaus – can introduce an object clause (which,
what, if…) |
whinf – can introduce an infinitive-phrase (how, which,
what…) |
person – a person (who) |
advsubj – can be the subject of the clause (who,
which, that…) |
anonsubj – can not be the subject of the clause
(why,) |
adverbial – can introduce an adverbial clause
(though, if…) |
4.12 for prepositions or pp: [3]
advb – mostly used to be an adverbial (during, by…) |
attr – mostly used to be an attributive (like,
regarding…) |
ingpred – when a ving after it, ving mostly is a
quasipredicate (by…) |
4.13 for punctuations: [9]
symbolic – a symbolic (&, #...) |
fullstop – fullstop (“.”. “…”) |
quesmark – question mark (?) |
bracket – brackets (“”, (, ) |
hyphen – hyphen (-) |
comma – comma (,) |
colon – colon (:) |
title – (#) |
semicolon – (:) |
5. 5th domain – Chinese-transfer information
In fact, the information is for Chinese equivalents
For example,
specific classifiers for nouns (本,只...);
Chinese function words for verbs in passive (被,加以...) with "地" ending for adverbs.
11. What are the logico-semantic
relations used in HowNet Translation System?
They are as follows:
00 title |
题目、标题、题外话 |
02 ExtraSentence |
句外成分 (sentential adverbs,
like: Frankly speaking, in a word.) |
03 sentential |
句副词(如:一般情况下) |
04 comment |
评论性短语(如:众所周知) |
05-1 SincePeriod |
起自时段(近年来,近十年来,四年来,这些年来..) |
05-2 SincePoint |
起自时点 (建国以来,从小,自从他出国以来..) |
06 DurationBeforeEvent |
前耗时段 (不到三年就成名了) |
07-1 TimeAfter |
之后 |
07-2 TimeBefore |
之前 |
08 concession |
让步(如:尽管、虽然) |
09 condition |
条件(如:如果、要是) |
10-1 attrcl |
定语从句 |
10-2 advcl |
状语从句 |
20-1 agent |
施事 |
20-2 experiencer |
经验者 |
20-3 relevant |
关系主体 |
20-4 possessor |
领有者 |
20-5 coagent |
合作施事 |
22 byagent |
带被-施事 |
24 time |
时间 |
26 location |
处所 |
28 negfre |
否定频率(如:从不) |
30 demo |
指示(如:这、那种) |
32 quantity |
数量/次第 |
34 also |
也(如:她也来了) |
36 emphasis |
强调(绝对) |
38 will |
意志(如:他也会来) |
40 neg |
否定 |
42-1 must |
务必 |
42-2 seem |
似乎 |
42-3 able |
能够 |
44 frequency |
频率 |
48 cause |
缘由、原因 |
50 source |
来源(从书店买书,问她买了一本书) |
52-1 LocationThru |
经过处所 |
52-2 EventProcess |
事件经过 |
54 scope |
范围 |
56-1 AccordingTo |
根据 |
56-2 concerning |
有关 |
58 material |
材料 |
60-1 means |
手段 |
60-2 method |
方法 |
62 instrument |
工具 |
64 bapatient |
带把(pinyin: bǎ)-受事 (patient – in the
sentence contains 把) |
66-1 direction |
方向 |
66-2 aim |
目标 |
68 beneficiary |
受益者 |
70 contrast |
参照体 |
72 partner |
相伴体 |
74 accompaniment |
伴随 |
76 attributive |
定语 |
80 cost |
代价 |
82 degree |
程度 |
84 modifier |
修饰(通常是形容词) |
86 restrictive |
限定(通常是名词,如计算机软件) |
88 manner |
方式 |
92-1 LocationIni |
原处所(如:从北京) |
92-2 StateIni |
原状态(如:从英语) |
100 Head (Pivot) |
中心(中心事件、中心实体) |
110 equiv |
同位成分 |
117 target |
对象 |
118 distance |
距离 |
120 possession |
占有物 |
122-1 patient |
受事 |
122-2 PatientProduct |
受事成品 |
122-4 ContentProduct |
内容成品 |
122-5 descriptive |
描写体 |
122-6 isa |
类指 |
122-7 existent |
存现体 |
123 content |
内容 |
132 PartOfTouch |
触及部件 |
134-1 ResultIsa |
结果类指 |
134-2 ResultEvent |
结果事件 |
134-3 ResultWhole |
结果整体 |
136-1 PatientValue |
受事属性值/属性 |
140-1 LocationFin |
终处所 |
140-2 StateFin |
终状态 |
144 QuantityCompare |
比较量(如:这条路比那条长3公里) |
146-1 spefreq |
特定频率 |
146-2 times |
动量 |
150 result |
结果 |
160 purpose |
目的 |
162-1 duration |
时段 |
162-2 DurationAfterEvent |
后延时段 |
162-3 TimeFin |
终止时间 |
170 succeeding |
后续 |
180 remark |
注脚 |
Annexe 5 Exemples des microstructures de LexALP (1 p.)
<entry
id="fra.espèces_protégées.1038.e" lang="fra" legalSystem="AC" status="UNKNOWN"> <term>espèce protégée</term> <grammar>n.f.</grammar> <phraseological-unit>false</phraseological-unit> <domain>1.4</domain> <domain>4.4</domain> <usage frequency="common" geographical-code="AC" technical="false"/> <definition> <text> Espèce menacée ou vulnérable qui est protégée
de l’extinction par des mesures préventives. </text> <source date="2006/08/31" sourceType="Url"> http://glossary.eea.europa.eu/EEAGlossary/P/protected_species </source> <source date="2006/09/15" sourceType="Author">Randier (trad)</source> </definition> <context> <text> [L’] [é]tat des inventaires des espèces
animales sauvages [comprend l’élaboration de] [l]istes des espèces
protégées [.] </text> <source documentId="3491828" >Prot. PNEP, ann. I, art. 1.1.2.</source> </context> <note>...</note> <harmonisation-note>...</harmonisation-note> </entry> |
Figure 101 : Microstructure Xml du terme "espèce protégée"
<axie
id="axi..1432634.e"> <termref idref="ita.specie_protette_per_legge.1037.e" lang="ita"/> <termref idref="fra.espèces_protégées.1038.e" lang="fra"/> <termref idref="deu.rechtlich_geschützte_Arten.1039.e" lang="deu" /> <termref idref="slv.pravno_zavarovana_vrsta.1040.e" lang="slv"/> <termref idref="ita.specie_protetta.1200075.e" lang="ita"/> <termref idref="slv.zavarovana_vrsta.1256879.e" lang="slv"/> … <axieref idref="axi..2184588.e"/> <axieref idref="axi..2184615.e"/> … </axie> |
Figure 102 : Microstructure Xml d'une axie
Annexe 6
Implémentation de l'affichage en colonnes dans Pivax-2 (1 p.)
Nous avons présenté l'interface en colonnes dans Pivax-2 au II.4.3.2. Voir la Figure 31.
Pour l'implémentation, on a repris la méthode de H.-T. Nguyen. Il a créé un modèle d'affichage en colonnes (un fichier en Xhtml) dans Pivax-1. Voir la Figure 103.
Pour le résultat affiché sur l'interface, on copie le modèle comme un nœud, puis on remplace les contenus par les identificateurs.
Figure 103 : Modèle de l'affichage en colonnes |
Annexe 7
Schéma de la base de données lexicales de Libellex (1 p.)
|
Annexe 8 Algorithmes de calcul dans Pivax-3 en pseudo-code (1,5 p.)
Pour simplifier la présentation, on ne donne que l'algorithme principal de la consultation générale. La consultation avancée est basée sur ces algorithmes, mais utilise des conditions supplémentaires.
Entrée :
terme (t) et langue (lg) Sortie :
page affichée de la liste de consultation de toutes les langues /* Initialisation de la
liste des traductions de 1er niveau */ Collection_par_axie <entree_lexie>; /* Initialisation de la
liste des traductions de 2e et 3e niveau */ Collection_par_proaxie <entree_lexie, niveau>; Consultation_générale
(t, lg){ Collection (Collection_par_axie, Collection_par_proaxie) = Collect_des_liens (t, lg) Affichage (Collection_par_axie, Collection_par_proaxie) } /* Collecter tous les liens
possibles dans la BDLex */ Collect_des_liens
(t, lg) { Pour chaque volume de lexies (vol_lex) Si la langue de vol_lex = lg Pour chaque lexie entrée (lex) dans vol_lex // Chercher par la table d’indextaion
(cdm-headword) Si le mot-vedette (hw) = t /* Collecter tous les liens de lex dans sa table LINKS par la clé étrangère. Pour chaque
enregistrement reçu, on a le type de lien (type), le volume cible (volumetarget),
la référence cible (targetId), et l’étiquette (label).
*/ Select type, volumetarget, targetId, label from vol_lex_LINKS where
entryid = objectid_de_lex Si le type de lien (type) = axeme Liste_traduc_1
= Chercher_dans_volumes
(targetId, volumetarget); Pour chaque élément (ele) de la Liste_traduc_1 Si ele n’existe pas dans Collection_par_axie Collection_par_axie += ele fSi fPour fSi Si le type de lien (type) == prolexeme Liste_traduc_2 = Chercher_dans_volumes_prolexeme (targetId, volumetarget, lable_src) Pour chaque élément (ele2) de la Liste_traduc_2 Si ele2 n’existe pas dans Collection_par_pro Collection_par_proaxie += ele2 fSi fPour fSi fSi fPour fSi fPour Return Collection (Collection_par_axie et Collection_par_proaxie) } /* Trier et afficher */ Affichage
(Collection_par_axie, Collection_par_proaxie){ Pour chaque entre lexie de Collection_par_axie Chercher le mot-vedette (headword) dans sa table d’indexations Ajouter le headword dans List_traduction_niveau_1 fPour Pour chaque entrée lexie de Collection_par_proaxie Si cette lexie est la traduction de
deuxième niveau Chercher le mot-vedette (headword) dans sa table d’indexations Si ce headword n’est pas dans la List_traduction_niveau_1
Ajouter le headword dans List_traduction_niveau_2 fSi fSi fPour Si List_traduction_niveau_1
n’est pas vide Ajouter les élements de la List_traduction_niveau_1 dans le
module du premier niveau de traduction dans la page
Xhtml. fSi Si List_traduction_niveau_2
n’est pas vide Ajouter les élements de la List_traduction_niveau_2 dans le
module du deuxième niveau de traduction dans la
page Xhtml fSi Collection_tous
= Distinct (Collection_par_axie + Collection_par_proaxie) Pour chaque lexie de Collection_tous Nœud_Xhtml = Mise en forme de nœud Xml de
lexie à l’aide de feuilles de style Ajouter Nœud_Xhtml dans le module du troisième niveau de traduction dans
la page Xhtml fPour } /*Chercher récursivement les
traductions par axème et axie*/ Chercher_dans_volumes
(targetId, volumetarget) { Chercher les liens vers les axèmes puis vers les axies puis vers les axèmes cibles puis chercher les lexies cibles /* type de lien
= final, s’arrêter*/ return toutes
les entrées trouvées } /*Chercher récursivement les
traductions par prolexeme et proaxie et traitement d’étiquette*/ Chercher_dans_volumes_pro
(targetId, volumetarget, lable_src)
{ Chercher les liens vers les prolexèmes puis vers les proaxies puis vers les prolexèmes cibles puis chercher les lexies cibles /* type de lien = final,
s’arrêter*/ Si l’étiquette de prolexème cible vers
lexie cible = lable_src Marquer que c’est la traduction de
deuxième niveau Sinon Marquer que c’est la traduction de
troisième niveau fSi return toutes
les entrées trouvées avec leurs niveaux } |
Annexe 9 Expérience sur les appels de Tradoh par SECTra via ActiveMQ pour les prétraductions (11 p.)
Nous avons brièvement présenté cette expérience au IV.1.3.3. Cette expérience concerne quatre spécifications. Selon l'ordre des appels (SECTra→ActiveMQ→Tradoh→ActiveMQ→SECTra), il s'agit de : (1) application émettrice de SECTra, (2) application réceptrice de Tradoh, (3) application émettrice de Tradoh, et (4) application réceptrice de SECTra.
Le texte source chinois a été produit par L. X. Wang. Il s'agit une partie d'un corpus économique.
Dans cette expérience, l'entrée est un fichier txt, chaque ligne contient un segment. L'application émettrice de SECTra lit ce fichier, puis récupère les segments et envoie un par un vers la queue de Tradoh (via ActiveMQ). C'est-à-dire que chaque requête contient un seul segment[3].
Tradoh envoie les traductions une à une dans la queue de Sectra (via ActiveMQ). Puis l'application réceptrice de SECTra regroupe toutes les traductions grâce à un identifiant de groupe de requêtes (JMSXGroupID, voir plus bas).
2. Description détaillée et algorithme (3,5 p.)
Pour bien comprendre les algorithmes, on présente d'abord les interfaces de ActiveMQ[4], puis les descriptions détaillées de message. Ces présentations sont purement techniques, mais nous aident à comprendre comment fonctionne ActiveMQ.
Table 15 : Interfaces d'ActiveMQ
Interfaces |
Description |
ConnectionFactory |
Un objet
administré par le fournisseur (provider)
pour créer une Connection. |
Connection |
Une connexion
active vers un JMS fournisseur. |
Destination |
Encapsule l'identité
d'une destination. |
Session |
Contexte (mono-processus)
pour l'émission et la réception de messages. |
MessageProducer |
Objet pour l'envoi
de messages vers une Destination (créé par la Session). |
MessageConsumer |
Objet pour la réception
de messages d'une destination (créé par la Session). |
Message |
Encapsulation d'un
message, Chaque message contient une structure à trois niveaux :
entête, propriété et corps (voir la table ci-dessous). |
Table 16 : Structure de message
Niveaux |
Description |
Entête (header) |
Attributs
communs (voir IV.1.3.1.2), destinés au routage et à l'identification du
message. |
Propriété (property) |
Champs
supplémentaires pour les propriétés optionnelles, par exemple, JMSXGroupID (groupe de messages), JMSXRcvTimestamp (date de réception), etc. |
Corps (body) |
Il existe 5
sous-types : StreamMessage, MapMessage, TextMessage, ObjectMessage, et BytesMessage. Cela permet d'accpeter
non seulement les objets Java, mais aussi d'autres types messages. Par exemple,
pour TextMessage, ça pourrait être de type String ou un document XML. |
Les applications émettrices sont basées sur 2 étapes de traitement.
1. Créer la connexion avec le serveur ActiveMQ, préciser les contextes de session (par exemple, c'est un émetteur et correspond à SECTra).
2. Envoyer le(s) message(s).
Les applications réceptrices sont également basées sur 2 étapes de traitement.
1. Créer la connexion avec le serveur ActiveMQ, préciser les contextes de session, écouter récursivement. S'il y a un message arrivé, on appelle le traitement spécifique (la méthode principale).
2. Par exemple, pour l'application réceptrice de Tradoh, on a la méthode call_Tradoh qui est un "interprète" de messages (chaque message est sous une forme prédéfinie, ex. segment_source|langue_source|langue_cible|système_TA|id_segment[5]). Cette méthode call_Tradoh s'occupe également l'envoi de la requête à l'Api de Tradoh. Après reçu le résultat de Tradoh, elle envoie le symbole acknowledge à ActiveMQ. À la fin, elle vérifie s'il y a la valeur pour l'attribut ReplyTo. Si oui, elle appelle l'application émettrice de Tradoh pour envoyer la réponse.
Voici l'algorithme d'application réceptrice de Tradoh.
/*Application réceptrice de
Tradoh*/ Receiver_Tradoh { /* Le code de connexion est
un code de « formule » pour connecter ActiveMQ par un récepteur */ /* On doit mettre ce code
dans toutes les applications réceptrices */ /* Création connectionFactory */ ConnectionFactory
connectionFactory; /* Initialisation connection */ Connection connection
= null; /* Création Session */ Session
session; /* Création destination */ Destination
destination; /* Création
consumer */ MessageConsumer
consumer; /* Établissement de la connection avec le serveur ActiveMQ */ connectionFactory
= new ActiveMQConnectionFactory( /*nom
d’administrateur, configurer dans le fichier conf */ "aximag2",
/*mot de passe,
configurer dans le fichier conf */ "iMAG04",
/*protocole et adresse
du serveur*/ "tcp://46.105.41.94:61616"); /* Initialisation
des délais temporels */ TIMEOUT =
180s ; TIMESLEEP =
30s ; TIMEWAIT =
1s ; /* Préciser les contextes de session. */ try { connection
= connectionFactory.createConnection(); connection.start(); /* On utilise ACKNOWLEDGE comme
mode de session pour s’assurer du bon
traitement de la requête */ session =
connection.createSession(Boolean.TRUE, Session.AUTO_ACKNOWLEDGE); /* On utilise Queue (file
d’attente de messages) comme mécanisme de traitement et on précise la
destination (Tradoh). Si Tradoh n’a pas de Queue associée sur le serveur, ActiveMQ
la crée automatiquement. Ensuite ActiveMQ crée la
connexion avec la Queue Tradoh, existante ou juste créée.*/ destination
= session.createQueue("Tradoh"); /* Initialisation du
« consommateur » */ consumer =
session.createConsumer(destination); /* Écouter en boucle infini */ while
(true) { /* Essayer
de recevoir un message */ Message
message = consumer.receive(); if (message
!= null) { /* On utilise un Timer pour
éviter d’attendre un message « mort »*/ Timer T1 = SystemTime ; /* Appeler le programme
spécifique, et recevoir la confirmation
de l’appel*/ boolean
res = call_Tradoh(message.getText()) ; /* Attendre
le résultat avec une limite de temps. Il y a 3 situations :
une bonne réponse, une mauvaise réponse, pas de réponse */ while
(true) { if(res){ /*Recevoir un bon
résultat, on envoie le symbole acknowledge */ message.acknowledge(); break ; }else if(res==null){
Timer T2 = SystemTime ; /*On attend, si on n’a
pas reçu la réponse dans TIMEOUT*/ /*Si le temps est
dépassé, on renonce au message. */ if
(T2-T1<TIMEOUT){
sleep (TIMEWAIT) ;
}else{ break ; } }else
{ /*res==false*/ /* mauvaise réponse,
on ne peut pas recevoir la réponse de Tradoh*/
break ; } } } else { /*S'endormir
TIMESLEEP si pas de message*/ sleep(TIMESLEEP) ; break; } } } catch (Exception
e1) {
Débug e1; } } /* Code spécifique pour Tradoh*/ call_Tradoh(Message msg){ msg_type =
msg.getType() ;
if(msg_type==TextMessage){ /* message
est sous forme segment_source|langue_source|langue_cible|système_TA|id_segment
*/ param =
message.split("\\|"); segment =
param[0]; ls =
param[1]; lc = param[TM/2]; TA =
param[3]; id_segment
= param[4]; /* API de Tradoh*/ url = "http://46.105.41.94/tradoh/?text="+segment+"&source="+ls+"&target="+lc+"&MT="+TA+"&piv=&verbose=0&outFormat=text&nocache=1"; /* Appeler d’API et récupérer
le résultat par la méthode get*/ Document doc ; String segment_traduction; try{ doc = Connect(url).timeout(TIMEOUT).get(); segment_traduction = doc.body().text(); }catch
(Exception e){ Débug
e ; Return
false ; /*mauvaise réponse*/ } /*Vérifier
si le message a besoin de renvoyer la réponse */ Destination
destination = msg.getReplayTo() ; if
(destination != null){ /*reconstruire le résultat sous la forme segment_cible|langue_source|langue_cible|système_TA|id_segment
*/
message_traduction = segment_traduction|ls|lc|TA|id_segment ; Sender_Tradoh.sender(message_traduction,
"TextMessage", destination); } } /*Traitement pour autres types de
message, dans nos premières implémentations, on utilise
seulement le type TextMessage */ /* if(msg_type==MapMessage){…} if(msg_type==BytesMessage){…} … */ } |
L'algorithme du côté de l'application émettrice ressemble à l'algorithme
ci-dessus, mais est plus simple, nous ne le détaillons pas.
3. Fichier des requêtes en source (3 p.)
Start Time : 2015/09/18 15:19:52 贸易和发展理事会|zho|fra|Google|1 商品和服务贸易及初级商品委员会|zho|fra|Google|2 专业服务和管理框架对贸易和发展 的影响专家会议|zho|fra|Google|3 2005年1月17日至19日,日内瓦|zho|fra|Google|4 专业服务和管理框架对贸易和发展的 影响专家会议的报告|zho|fra|Google|5 2005年1月17日至19日 在日内瓦万国宫举行|zho|fra|Google|6 目 录|zho|fra|Google|7 章 次 页 次|zho|fra|Google|8 一、主席的总结3|zho|fra|Google|9 二、组织事项26|zho|fra|Google|10 附 件|zho|fra|Google|11 出席情况27|zho|fra|Google|12 第 一 章|zho|fra|Google|13 主席的总结|zho|fra|Google|14 1. 专业服务和管理框架对贸易和发展的影响专家会议于2005年1月17日至19日在日内瓦举行。|zho|fra|Google|15 对于发达国家和发展中国家的政府如何能够在国家层次和多边谈判中为促进专业服务贸易发挥积极作用,专家们提出了自己的看法。|zho|fra|Google|16 贸发会议秘书处编写的背景说明“专业服务和管理框架对贸易和发展的影响”和题为“专业人员走出国界:互认协定与《关贸总协定》”的讨论文件受到了称赞。|zho|fra|Google|17 对于这些文件涉及的问题,各方表示了不同的意见。|zho|fra|Google|18 从下文中可以看出,表示的意见和提出的建议是丰富多样的。|zho|fra|Google|19 一、专业服务与发展|zho|fra|Google|20 全球市场的走向|zho|fra|Google|21 2. 全球所有专业服务市场的总额在2002年达到10,000亿美元以上。|zho|fra|Google|22 专业服务是全世界各经济体中增长最迅速的一个部门。|zho|fra|Google|23 这些服务中的就业增长速度超过了经济其他部门。|zho|fra|Google|24 发展中国家专业服务贸易的相对重要性与发达经济体不同,出现了下降,而发达国家的公司在所有的全球专业服务市场都占有主导地位。|zho|fra|Google|25 在公司和国家层次,正在出现许多专业服务集中化的趋势。|zho|fra|Google|26 同时,摆在专业服务提供者面前的是生产的全球化,区域贸易和南南贸易份量的不断增加以及竞争相关问题重要性的不断增加。|zho|fra|Google|27 虽然服务业对发展中国家国内生产总值的贡献不断加大,但在贸易总量中的份额仍然落在货物贸易的后面,与发达国家相比尤其如此。|zho|fra|Google|28 专业服务的作用|zho|fra|Google|29 3. 专业服务作为增强经济竞争力的一种基础设施服务发挥着重要的作用。|zho|fra|Google|30 这类服务是所有商业活动的投入,其质量和竞争力决定着外溢效应的规模。|zho|fra|Google|31 专业服务具有的一种关键发展影响在于对人们往往称之为“知识经济”的贡献。|zho|fra|Google|32 经济学者发现,人力资本、增加值和经济增长率之间存在着密切关联,而专业服务往往处在创新的前沿。|zho|fra|Google|33 这类服务,尤其是在发展中国家和最不发达国家,对于实现《千年宣言》的社会经济发展目标具有直接影响。|zho|fra|Google|34 另外,服务贸易问题与《千年宣言》的减贫承诺、目标8的实现以及建立全球发展伙伴关系的努力都直接相关。|zho|fra|Google|35 4. 专业服务包括经认证的专业,如律师、医生、会计师、建筑师和工程师,也包括未经认证的或自由操业专业。|zho|fra|Google|36 专业服务的范围和定义各国有所不同。|zho|fra|Google|37 多数发展中国家接受的是专业服务的一种广义定义,其中包括与土著产品贸易相联的新服务或与其他服务贸易联系在一起的服务,如海事服务,尤其是计算机和相关服务。|zho|fra|Google|38 例如,在卢旺达,除了传统的专业人员以外,银行人员和保险业人员也被认为是专业人员。|zho|fra|Google|39 专业服务贸易与发展中国家|zho|fra|Google|40 5. 发展中国家的经验清楚地显示了专业服务贸易可为其带来的发展收益。|zho|fra|Google|41 专业服务出口在2002年达到2,700亿美元,发展中国家占总出口的15%。|zho|fra|Google|42 由于缺乏充分的分类数据,现在无法正确评估发展中国家专业服务出口的走势和贸易方向。|zho|fra|Google|43 看来,商业机会主要为大型跨国专业公司所用,这类公司存在于若干市场,与当地公司相联,是全球网络的一部分。|zho|fra|Google|44 在订有相互承认协定时,专业服务提供者提供服务就可得到便利。|zho|fra|Google|45 对于其他专业服务提供者来说,在国外提供服务的机会相当有限。|zho|fra|Google|46 所有服务提供者,包括中小型企业,都有利基市场,因为专业服务带来的是大量商机(例如,联合王国的专业服务占国内生产总值的15%),而且并不仅仅限于大型公司。|zho|fra|Google|47 对于多数发展中国家而言,专业服务出口的规模仍然不大,但在有些情况下实现了业绩突出的增长率。|zho|fra|Google|48 例如,哥伦比亚就属于这种情况,该国的商业服务出口在近些年来实现了13%的年增长率,安第斯各国吸收了其总出口的31%。|zho|fra|Google|49 另外,像巴西和印度这类发展中国家正在成为专业服务的全球角色。|zho|fra|Google|50 印度的外包公司就是成功融入世界市场的一个例子。|zho|fra|Google|51 全球服务外包预期到2006年将达到1万亿美元,其中只有2%是国际间的交易。|zho|fra|Google|52 美国市场占印度外包的60%,但这在美国服务总进口中只不过是1%。|zho|fra|Google|53 印度的服务外包值从1999-2000年期间的5亿6,500万美元增加到了2003-2004年期间的36亿美元。|zho|fra|Google|54 联合王国已经成为印度外包服务的第二大市场,并且成为480家印度公司的业务基地,这些公司设在联合王国,以便进入欧盟市场。|zho|fra|Google|55 由此而来的两国之间双边投资流动近来已经达到了平衡状态。|zho|fra|Google|56 就巴西而言,服务总出口的36%是商业和专业服务,其中大部分是工程和建筑服务。|zho|fra|Google|57 6. 经济规模小的发展中国家,如加勒比共同体各国和毛里求斯,往往依赖服务部门对国内生产总值和就业作出主要贡献。|zho|fra|Google|58 小岛屿发展中国家趋于保持一种开放型贸易制度,金融服务和旅游服务占有最大的贸易份额,是经济和发展的主要推动力量,而专业服务是这些部门的重要投入。|zho|fra|Google|59 小岛屿发展中国家的进一步贸易和发展必须明确无误地依赖于在国内生产总值中已经占三分之二以上的服务业。|zho|fra|Google|60 一些最不发达国家,如卢旺达,成功地保持了高经济增长率,其原因在很大程度上并不仅仅是电信、旅游和运输服务的壮大,而且还有包括咨询服务在内的专业服务的增长。|zho|fra|Google|61 新动态:外包|zho|fra|Google|62 7. 发展中国家外包产业的发展为其社会经济发展带来了直接或间接的收益。|zho|fra|Google|63 例如,在印度,预计到2008年在这一产业中就业的人将达到200万,按照系数为3的乘数效应,在次级就业中还将创造出更多的工作职位。|zho|fra|Google|64 外包方式通过在其他国家建立起专营店,推动了提供计算机教育培训的民办教育领域的贸易。|zho|fra|Google|65 这些服务已经发展到了提供基本的计算处理和更高级培训的程度,因为大学动作太慢,无法适应新技术的需求和针对迅速变化的市场作出反应。|zho|fra|Google|66 外包产业提供了薪金较高的工作岗位,带来了收入的增长,推动了消费。|zho|fra|Google|67 这一部门的年工资增长率为15%。|zho|fra|Google|68 雇员中的高减员率表明,外包服务产业创造的技能是“便携式”的。|zho|fra|Google|69 因此,这些技能就能够向国内产业转移。|zho|fra|Google|70 电信法规改革及电信业自由化降低了电信服务的费用,这得到了全球外包产业需要的推动。|zho|fra|Google|71 为了加强在出口市场中的地位,外包服务业的公司力求得到设在自己出口市场的公司开出的高质量证明,以求保持产品的质量水准和满足西方国家客户的需要。|zho|fra|Google|72 由于这一服务产业中的人员有40%至60%是女性,外包服务通过提供过去几乎没有的更高增值就业机会对于提高女性地位有着突出的影响。|zho|fra|Google|73 这一部门还诞生出了印度的多国公司,既TCS、Infosys和Wipro, 这些公司在范围广泛的服务中正在取得国际竞争力,并在全球扩张其业务活动。|zho|fra|Google|74 最后,信息和通信技术部门的成功对于打造印度品牌作出了贡献,在诸如旅游、娱乐、专业服务和其他服务的部门内产生了积极的外溢效应。|zho|fra|Google|75 贸易和发展基准|zho|fra|Google|76 8. 在专业服务领域,有可能制订贸易和发展基准(见下文),在预期这些服务对发展所作贡献的基础上评估发展中国家是否正在切实有效地融入国际贸易体系和贸易谈判并从中获得益处。|zho|fra|Google|77 发展中国家专业服务的供应能力和竞争力。|zho|fra|Google|78 这方面的主要决定因素是高等和技术教育的质量和推广。|zho|fra|Google|79 与其他一些服务部门不同,这方面的比较优势在于成本、质量、竞争性劳动力的组合和在相关领域创造、应用和传播专门知识。|zho|fra|Google|80 在新兴的知识经济方面,除其他外,由商业咨询、信息技术服务、研究与发展、以及设计和工程服务构成的这类服务是竞争力的主要因素。|zho|fra|Google|81 由于发展中国家的中小企业规模不大,难以获得充足的资本和信贷,无法承担较大的商业风险,特别是不能像发达国家的中小型企业那样,在发展中国家的国家一级没有特别方案和公共支助措施,因此处于特别不利的地位。|zho|fra|Google|82 加大发展中国家在专业服务贸易中的份额和加强发展中国家对于国际贸易中新兴和有活力部门的参与。|zho|fra|Google|83 应当指出,虽然发展中国家不断加大了对于专业服务进口的参与,而且也加强了对于这方面出口的参与,但这些国家仍然是专业服务的净进口国。|zho|fra|Google|84 有出口的仅仅是少数发展中国家,并局限于传统的专业活动,主要是通过模式4和1实现的。|zho|fra|Google|85 但是,发展中国家的公司正在开发有竞争力的利基市场,如专业化的保健服务、包括生物技术在内的研发服务、计算机服务和工程服务。|zho|fra|Google|86 对发展中国家出口的市场开往程度及发展中国家市场对其他国家开放。|zho|fra|Google|87 澳大利亚生产力委员会近期的一项研究对于跨专业和跨国家的限制性程度作了比较,其中表明,认证专业的贸易在全世界都仍然面临着严重的限制。|zho|fra|Google|88 专业服务提供者在开业方面往往比已在运行的业务活动面临更多的限制。|zho|fra|Google|89 据指出,在认证专业中,法律服务最受限制,接下来是会计、建筑和工程服务。|zho|fra|Google|90 但受影响最严重的是发展中国家专业人员的流动问题,因为目前存在着市场准入和入境障碍,包括在注册、许可、核证、承认和认证方面的国内法规以及关于居住、国籍或公民权规定的影响。|zho|fra|Google|91 发达国家已经看到了定价和广告限制这类反竞争做法对其竞争力和服务出口产生的负面影响。|zho|fra|Google|92 另外,发达国家市场势力强大的有组织利害关系方实行的反竞争做法也带来了障碍,影响了发展中国家的供应者,除其他外,有可能抵消贸易自由化特别是为中小型企业和消费者带来的积极影响。|zho|fra|Google|93 就发展中国家的自由化而言,虽然扶持国内供应能力和竞争力以及扩大基本服务准入的政策空间是尤其必要的,但技能转让、投资促进和并入全球网络是尽量扩大贸易对增长和发展的贡献的必要条件。|zho|fra|Google|94 减贫、男女平等和福利、公共利益、创造就业、技能开发和增值、信通技术传播和技术创新。|zho|fra|Google|95 专业服务与自己的精英形象正相反,它能帮助人民摆脱贫困,而高效率和得到推广的专业服务也就能够因此而对公共利益作出贡献,通过提供更好的保健和教育及社会服务等等减轻贫困的负面影响。|zho|fra|Google|96 专业服务的发展在发展中国家是新的和更多的高薪及正规就业的来源。|zho|fra|Google|97 它是由技能发展所推动的,并且有助于提高货物、服务和贸易生产的增加值。|zho|fra|Google|98 多数发展中国家的专业服务有高度的性别敏感力和积极影响。|zho|fra|Google|99 例如,妇女在国内外都积极地从事护士、教师和社会工作者的服务。|zho|fra|Google|100 longueur moyenne 39.66 End Time : 2015/09/18 15:19:52 |
4. Prétraductions reçues (4 p.)
Conseil du commerce et du développement|zho|fra|Google|1 Commerce des marchandises et des services et produits de
base|zho|fra|Google|2 Impact sur les réunions de commerce et d'experts du développement de
services professionnels et de cadres réglementaires|zho|fra|Google|3 Le 17 janvier 2005 à 19, Genève|zho|fra|Google|4 Rapport des services professionnels et des cadres réglementaires pour
l'impact du commerce et du développement de réunions d'experts|zho|fra|Google|5 Tenue au Palais des Nations 2005 年 17 à 19 Janvier|zho|fra|Google|6 SOMMAIRE|zho|fra|Google|7 Chapitre Page|zho|fra|Google|8 Tout d'abord, le résumé du Président 3|zho|fra|Google|9 Questions d'organisation 26|zho|fra|Google|10 ANNEXE|zho|fra|Google|11 Participation 27|zho|fra|Google|12 Premier chapitre|zho|fra|Google|13 Résumé du président|zho|fra|Google|14 L'impact sur le commerce et expert en développement réunion 1. Les
services professionnels et des cadres réglementaires en 2005 17 Janvier au 19
à Genève.|zho|fra|Google|15 Pour le Gouvernement des pays développés et en développement sur la façon
de promouvoir le commerce dans les services professionnels peuvent jouer un
rôle actif au niveau national et des négociations multilatérales, les experts
ont présenté leurs vues.|zho|fra|Google|16 Note d'information établie par le secrétariat de la CNUCED "services
professionnels et l'impact des cadres de réglementation sur le commerce et le
développement», et intitulé «professionnels là-frontières: accords de reconnaissance
mutuelle avec le" "" document de travail du GATT a été
salué.|zho|fra|Google|17 Pour toute question concernant ces documents, les parties ont exprimé des
opinions différentes.|zho|fra|Google|18 Comme on peut le voir dans ce qui suit, les recommandations et les
observations faites dans une variété de spectacles.|zho|fra|Google|19 Un service professionnel et le développement|zho|fra|Google|20 Les tendances du marché mondial|zho|fra|Google|21 2. La quantité totale de tous les marchés de services professionnels à
travers le monde a atteint plus de 1 billion $ en 2002.|zho|fra|Google|22 Services professionnels est les économies du monde dans l'un des secteurs
à plus forte croissance.|zho|fra|Google|23 Ce emploi dans les services a progressé plus vite que le reste de
l'économie.|zho|fra|Google|24 L'importance relative du commerce des services professionnels dans les
pays en développement et les pays développés, il a été diminué, tandis que
les entreprises dans les pays développés sur tous les marchés mondiaux de
services professionnels sont dominants.|zho|fra|Google|25 Dans les entreprises nationales et les niveaux, de nombreux services
professionnels centralisés tendances émergentes.|zho|fra|Google|26 Dans le même temps, placé en face d'un fournisseur de services
professionnels est la mondialisation de la production, l'augmentation du
commerce régional et l'augmentation des échanges Sud-Sud et les questions
liées à la concurrence importance lourde.|zho|fra|Google|27 Bien que la contribution du secteur des services au PIB dans les pays en
développement continuent d'augmenter, mais sa part dans le commerce total
reste à la traîne commerce des marchandises, par rapport aux pays développés
en particulier.|zho|fra|Google|28 Le rôle des services professionnels|zho|fra|Google|29 3. Les services professionnels afin d'améliorer la compétitivité
économique comme un service d'infrastructure joue un rôle
important.|zho|fra|Google|30 Ce service est mis toutes les activités commerciales, la qualité et la
compétitivité de déterminer la taille des effets
d'entraînement.|zho|fra|Google|31 Un impact sur le développement crucial des services professionnels réside
dans la contribution des personnes ont souvent appelé «l'économie de la
connaissance».|zho|fra|Google|32 Les chercheurs en économie ont trouvé que le capital humain, il existe
une corrélation étroite entre la croissance économique et l'augmentation de
la valeur, et les services professionnels sont souvent à la pointe de
l'innovation.|zho|fra|Google|33 Ces services, en particulier dans les pays en développement et les moins
avancés, pour obtenir la "Déclaration du Millénaire" des objectifs
socio-économiques de développement a un impact direct.|zho|fra|Google|34 En outre, la réduction du commerce des services et de la pauvreté, de
l'engagement "Déclaration du Millénaire", la mise en œuvre, et
d'établir un partenariat mondial pour les efforts de développement sont
directement liés à l'objectif 8.|zho|fra|Google|35 4. Les services professionnels comprennent des professionnels certifiés
tels que les avocats, les médecins, les comptables, les architectes et les
ingénieurs, ainsi que des non autorisées ou libres professionnels de
l'industrie de l'exercice.|zho|fra|Google|36 La portée et la définition des services professionnels varient
Unis.|zho|fra|Google|37 La plupart des pays en développement à accepter une définition large de
services professionnels, y compris les nouveaux services et produits associés
commerciales ou le commerce des liens indigènes avec d'autres services avec
des services tels que les services maritimes, notamment informatiques et
services connexes.|zho|fra|Google|38 Par exemple, au Rwanda, en plus de professionnels traditionnels, les
banquiers et le personnel d'assurance sont considérés comme des professionnels.|zho|fra|Google|39 Professionnel commerce des services avec les pays en
développement|zho|fra|Google|40 5. L'expérience des pays en développement montre clairement les avantages
des services de développement des affaires professionnelles à sa portée.|zho|fra|Google|41 Les exportations de services professionnels ont atteint 270 milliards de
$ en 2002, 15% des exportations totales des pays en
développement.|zho|fra|Google|42 En raison de l'absence de données ventilées adéquates, nous ne pouvons
pas évaluer correctement le sens de la tendance et le commerce des
exportations de services professionnels des pays en
développement.|zho|fra|Google|43 Opinion, les occasions d'affaires sont principalement utilisés par les
grandes entreprises transnationales professionnels, ces entreprises existent
dans un certain nombre de marchés, associée avec des entreprises locales, il
fait partie d'un réseau mondial.|zho|fra|Google|44 Accords de reconnaissance mutuelle dans l'ordre, les fournisseurs de
services professionnels pour fournir des services peuvent être
facilitées.|zho|fra|Google|45 Pour les autres fournisseurs de services professionnels, la possibilité
de fournir des services dans un pays étranger est assez
limité.|zho|fra|Google|46 Tous les fournisseurs de services, y compris les PME, ont un marché de
niche, car un grand nombre de services professionnels pour apporter des
affaires (par exemple, les services professionnels Royaume-Uni représentaient
15% du PIB), mais ne se limite pas aux grandes entreprises.|zho|fra|Google|47 Pour la plupart des pays en développement, l'ampleur des exportations de
services professionnels est encore petit, mais dans certains cas d'atteindre
un taux de rendement exceptionnel de croissance.|zho|fra|Google|48 Par exemple, comme cela est le cas de la Colombie, les services
commerciaux, les exportations du pays au cours des dernières années pour
atteindre un taux de croissance annuel de 13%, les pays andins d'absorber 31%
de ses exportations totales.|zho|fra|Google|49 En outre, les pays en développement comme le Brésil et l'Inde sont de
plus le rôle mondial de services professionnels.|zho|fra|Google|50 Entreprises indiennes d'externalisation est un exemple d'intégration
réussie dans le marché mondial.|zho|fra|Google|51 Externalisation mondiale devrait à 2006 atteindra $ 1000000000000, dont
seulement 2% a été négociée à l'échelle internationale.|zho|fra|Google|52 Le marché américain a représenté 60 pour cent de la sous-traitance de
l'Inde, mais le service aux États-Unis dans les importations totales est
seulement un pour cent.|zho|fra|Google|53 Inde valeur de la sous-traitance de 1999 - 500 millions de $ 65 millions
au cours de la période de 2000 à 2003 - $ 3,6 milliards en
2004.|zho|fra|Google|54 Le Royaume-Uni est devenu le deuxième plus grand marché pour les services
d'externalisation indiennes, 480 en Inde et est devenu la base de
l'entreprise de la société, ces sociétés basées au Royaume-Uni, afin d'entrer
dans le marché de l'UE.|zho|fra|Google|55 L'investissement bilatéral coule entre les deux pays résultant de
l'équilibre a récemment atteint.|zho|fra|Google|56 Pour le Brésil, desservant 36 pour cent du total des exportations de
services commerciaux et professionnels, dont la plupart sont d'ingénierie et
de construction.|zho|fra|Google|57 6. La petite taille de l'économie des pays en développement, tels que les
pays de la Communauté des Caraïbes et l'île Maurice, ont tendance à compter
sur le secteur des services domestiques PIB et l'emploi à faire des
contributions majeures.|zho|fra|Google|58 PEID ont tendance à maintenir un système commercial ouvert, les services
financiers et les services touristiques représentent la plus grande part du
commerce, est la principale force motrice pour le développement économique
et, et les services professionnels sont des éléments importants dans ces
secteurs.|zho|fra|Google|59 Davantage le commerce et le développement des petits États insulaires en
développement doivent sans ambiguïté dépend du produit intérieur brut a plus
que deux tiers des services.|zho|fra|Google|60 Certains des pays les plus développés, tels que le Rwanda, a réussi à
maintenir un taux élevé de croissance économique, qui est en grande partie la
raison est non seulement télécommunications, le tourisme et l'expansion des
services de transport, y compris, mais également des services consultatifs, y
compris les services professionnels croissance.|zho|fra|Google|61 Nouveaux développements: Externalisation|zho|fra|Google|62 7. Le développement de l'industrie de l'externalisation dans les pays en
développement pour le développement social et économique a apporté des
avantages directs ou indirects.|zho|fra|Google|63 Par exemple, en Inde, est attendu pour 2008, l'emploi dans cette
industrie atteindra les 2 millions, selon le coefficient de l'effet
multiplicateur de 3 dans l'emploi secondaire va créer plus
d'emplois.|zho|fra|Google|64 L'externalisation par les magasins de franchise établis dans d'autres
pays, afin de promouvoir le commerce fournir une éducation de formation en
informatique et dans le domaine de l'enseignement privé.|zho|fra|Google|65 Ces services ont été développés dans la mesure de fournir l'informatique
de base et une formation plus poussée, parce que l'université trop lent,
incapable d'adapter aux besoins de la nouvelle technologie et de réagir
contre un marché en évolution rapide.|zho|fra|Google|66 Outsourcing fournit un emploi salariaux élevés, ce qui porte la
croissance des revenus, et de promotion de la consommation.|zho|fra|Google|67 La croissance annuelle des salaires dans ce secteur est de
15%.|zho|fra|Google|68 Les employés des taux d'attrition élevés suggèrent que l'externalisation
industries pour créer compétences sont "portable"
en.|zho|fra|Google|69 Par conséquent, ces compétences seront en mesure de transférer à l'industrie
nationale.|zho|fra|Google|70 Télécommunications réforme de la réglementation et la libéralisation du
secteur des télécommunications dans la réduction du coût des services de
télécommunications, qui a été la promotion des besoins de l'industrie mondiale
de l'externalisation.|zho|fra|Google|71 Afin de renforcer sa position dans le marché de l'exportation, des
services d'impartition société a cherché à se mettre en place dans leurs
marchés d'exportation de sociétés de haute qualité à prouver, en vue de
maintenir les normes de qualité des produits et de répondre aux besoins des
clients dans les pays occidentaux.|zho|fra|Google|72 En raison de ce service personnel de l'industrie ont 40-60 pour cent sont
des femmes, en offrant des services à plus forte valeur ajoutée
sous-traitance dans le passé presque pas de possibilités d'emploi pour
améliorer le statut des femmes a une influence importante.|zho|fra|Google|73 Le ministère a également né de sociétés multi-nationales de l'Inde, à la
fois TCS, Infosys et Wipro, ces entreprises une large gamme de services qui
sont faits l'expansion compétitive au niveau international et mondial de ses
activités commerciales.|zho|fra|Google|74 Enfin, l'information et le secteur de la technologie de communication
pour la marque de construction réussie en Inde a contribué dans des secteurs
tels que le tourisme, les loisirs, les services professionnels et autres
services ont eu un effet d'entraînement positif.|zho|fra|Google|75 Repères de Commerce et développement|zho|fra|Google|76 8. Dans le domaine des services professionnels, la possibilité de
développer des référentiels de commerce et de développement (voir
ci-dessous), afin d'évaluer si les pays en développement sont effectivement
intégrés dans les négociations relatives au système commercial et
commerciales internationales sur la base de la contribution attendue au
développement de ces services sur et en tirer des avantages .|zho|fra|Google|77 La capacité d'offre et la compétitivité des services professionnels dans
les pays en développement.|zho|fra|Google|78 Le principal facteur déterminant à cet égard est la qualité de
l'éducation et de promotion supérieur et technique.|zho|fra|Google|79 Contrairement à d'autres secteurs de services diffèrent, l'avantage
comparatif à cet égard est que la combinaison de coût, de qualité, travail
concurrentiel et les domaines connexes à la création, l'application et la
diffusion de l'expertise.|zho|fra|Google|80 Dans la nouvelle économie du savoir, en plus d'autres choses, les
services de conseil en affaires et technologie de l'information, recherche et
développement, ainsi que des services de conception et d'ingénierie de tels
services constituent un facteur important de la compétitivité.|zho|fra|Google|81 En raison de la petite taille des PME dans les pays en développement, il
est difficile d'obtenir des capitaux et de crédit suffisant, ne peuvent se
permettre les risques commerciaux plus importants, en particulier les petites
et moyennes entreprises dans les pays développés ne peuvent pas être comme
ça, pas de programmes spéciaux au niveau national dans les pays en
développement et des mesures de soutien publiques, donc à un désavantage
particulier.|zho|fra|Google|82 Augmenter la part des pays en développement dans les échanges de services
professionnels et de renforcer la participation des pays en développement
dans le commerce international dans des secteurs nouveaux et
dynamiques.|zho|fra|Google|83 Il convient de noter que tandis que les pays en développement continuent
d'accroître la participation des importations de services professionnels,
mais aussi de renforcer la participation des exportations à cet égard, mais
ces pays sont encore des importateurs nets de services
professionnels.|zho|fra|Google|84 Il ya seulement quelques pays en développement, les exportations et les
activités professionnelles traditionnelles limitées, principalement par le
mode 4 et 1 mise en œuvre.|zho|fra|Google|85 Toutefois, les entreprises des pays en développement est de développer
des marchés de niche concurrentiels, tels que les services de santé
spécialisés, y compris la recherche en biotechnologie et des services de
développement, de services informatiques et de services
d'ingénierie.|zho|fra|Google|86 Pour les exportations des pays à destination du degré d'ouverture des
marchés et le développement de marchés à d'autres pays.|zho|fra|Google|87 Une étude australienne a comparé la récente Commission de la productivité
pour limiter l'ampleur de la multi-disciplinaire et de cross-country, ce qui
montre que le commerce professionnel certifié dans le monde est toujours
confronté à de sérieuses contraintes.|zho|fra|Google|88 Les prestataires de services sont souvent confrontés à en termes
d'ouverture plus limitée que ce qui a été l'organisation d'activités
d'affaires.|zho|fra|Google|89 Il a été noté que, dans le Certified Professional, les services
juridiques les plus limitées, suivis par les services de comptabilité,
d'architecture et d'ingénierie.|zho|fra|Google|90 Cependant, le plus touché est le flux de professionnels dans les pays en
développement, car actuellement il ya l'accès aux marchés et de barrières à
l'entrée, l'enregistrement, les licences, la certification, ainsi que la
législation nationale sur la résidence, la nationalité ou la reconnaissance
de la citoyenneté et de la certification, y compris dispositions
de.|zho|fra|Google|91 Les pays développés ont déjà vu les prix et de publicité restrictions
telles pratiques anti-concurrentielles sur la compétitivité et les
exportations de services ont généré un impact négatif.|zho|fra|Google|92 En outre, les puissants marchés organisés des pays développés à mettre en
œuvre les pratiques anti-concurrentielles des parties prenantes ont également
apporté trouble qui affecte les fournisseurs dans les pays en développement,
notamment, il est possible de compenser la libéralisation des échanges en
particulier pour les petites et moyennes entreprises et Consumer impact
positif.|zho|fra|Google|93 Sur la libéralisation des pays en développement, bien que le soutien aux
capacités nationales d'approvisionnement et la compétitivité, et élargir
l'accès aux services de base est un espace politique particulièrement
nécessaire, mais le transfert des compétences, la promotion des
investissements et de l'intégration dans le réseau mondial de maximiser les
échanges sur la croissance et contribution au développement des conditions
nécessaires.|zho|fra|Google|94 Réduction de la pauvreté, l'égalité des sexes et le bien-être, l'intérêt
public, la création d'emplois, développement des compétences et la diffusion
des TIC à valeur ajoutée et l'innovation technologique.|zho|fra|Google|95 Un service professionnel avec leur image élite contraire, elle peut aider
les gens à sortir de la pauvreté, et la haute efficacité et des services
professionnels sera promu peut donc contribuer à l'intérêt public en
fournissant de meilleurs soins de santé et l'éducation et les services
sociaux, etc. atténuer les effets négatifs de la pauvreté.|zho|fra|Google|96 Développement de services professionnels dans les pays en développement
sont sources d'emplois bien rémunérés et informel nouvelles et
supplémentaires.|zho|fra|Google|97 Elle est entraînée par le développement des compétences, et aider à
augmenter la valeur ajoutée des biens, des services et de la production commerciale.|zho|fra|Google|98 Services professionnels dans la plupart des pays en développement sont
très sensibles au genre vigueur et l'impact positif.|zho|fra|Google|99 Par exemple, les femmes sont activement engagés dans des infirmières
nationaux et étrangers, les enseignants et les travailleurs des services
sociaux.|fra|Google|100 End Time : 2015/09/18 15:20:33 |
Annexe 10 Spécifications de Lextoh (4 p.)
1. Configurations et descripteurs des outils utilisables
Notre fichier "RESSOURCES" permet de décrire les outils par langue ou par outil. Nous avons déjà montré un exemple de "ressource par outil" au IV.2.3.2.4. Voici un exemple de "ressource par langue".
<!-- Ressources connues de LEXTOH, par langue
--> <RESSOURCES
dateCreation = "20140221" dateDerniereModif = "20150508" typeRessources =
"parLangue"> <!-- Lemmatiseurs ou autres du français --> <LANGUE codeLG = "FRA"> <LM codeLM = "XIP" codeEnt =
"utf8" codeLGxip = "fr" transcription = "telQuel"
sortiesPossibles = "liste" url = "https://open.xerox.com/Services/XIPParser/Pages/Using%20XIP"
requeteType = "API" requete =
"http://atoum.imag.fr/getalp/Services/
Web/CREATDICO/callXip.php?lang=fra&text=$fichEnt "/> <LM codeLM = "Ariane_FR4"
codeEnt = "utf8" codeLGariane = "FR1" transcription =
"transIntermFr" sortiesPossibles = "arbre_A xml" url = "http://www.taranis-software.com"
requeteType = "CURL" requete = "curl
\"http://www.taranis-software.com/Heloise/Ying/test. php\" --data
\"InputText=$fichEnt&CoupleLangue=FR4-$fichSort\""/> <LM codeLM = "XELDA" codeEnt
= "utf8" codeLGxelda = "fr" transcription = "telQuel"
sortiesPossibles = "liste xml" url = "www.xrce.xerox.com/About-XRCE/History/Historical- projects/XeLDA/" requeteType =
"EXEC" requete = "xelda MorphoAnalysis
plaintext $fichSort $fichEnt fra FST FSTPOSTag " /> ... </LANGUE> <!-- Lemmatiseurs ou autres de l'anglais --> <LANGUE codeLG = "ENG"> <LM codeLM = "XELDA" codeEnt
= "utf8" codeLGxelda = "en" transcription = "telQuel"
sortiesPossibles = "liste xml" url = "www.xrce.xerox.com/About-XRCE/History/Historical- projects/XeLDA/"
requeteType="EXEC" requete = "xelda MorphoAnalysis
plaintext $fichSort $fichEnt eng FST FSTPOSTag " /> ... </LANGUE> </RESSOURCES> |
D'autre part, un descripteur permet de configurer les paramètres fixés, par exemple, la langue de dialogue pour l'interaction (pour l'instant, ne se fait que pour le français), les statistiques statiques pour voir les paramètres préférés pour chaque outil appelable.
<!-- Langue de dialogue --> <LANGUE
dateCreation = "20140221" dateDerniereModif = "20140515" CodeLang =
"fr" Mode="ACTIVE"/> <!-- LANGUE
dateCreation = "20140221" dateDerniereModif = "20140221"
CodeLang = "en" Mode=""--/> <!-- LANGUE
dateCreation = "20140221" dateDerniereModif = "20140221"
CodeLang = "zh" Mode=""--/> <!-- Statistiques statiques --> <Outil
codeLM = "XELDA" nbrCall = "1138" > <LANGUE codeLang = "fr"
typeSortie = "liste" nbrCall = "541"/> <LANGUE codeLang = "fr"
typeSortie = "xml" nbrCall = "80"/> <LANGUE codeLang = "en"
typeSortie = "liste" nbrCall = "462"/> <LANGUE codeLang = "en"
typeSortie = "xml" nbrCall = "55"/> <Outil/> <Outil
codeLM = "Ariane_FR4" nbrCall = "847" > ... <Outil/> |
2. Spécificiation des entrées (0,25 p.)
On a présenté les entrées de façon "naturelle" au IV.2.2.1. Voici la spécification des paramètres et des métadonnées concernant l'entrée. La syntaxe utilisée est celle d'Ariane-G5 pour la déclaration des variables.
-CHA- text == (inDefaut = 'textIn'). ** chaîne qui
peut avoir la syntaxe d'un chemin. -EXC- lang == (fra, zho, eng, deu, esp, por,
pol,…). **
EXC : exclusive -NEX- lemmat == (jieba, xelda, ariane-heloise,
xip,…). **
NEX : non exclusive, 1 ou plusieurs valeurs possibles dans la liste,
ensemble vide = lemmat0. -EXC- output == (txt, json, xml). -EXC- formalism == (reduit, graphe-Q). -EXC- debug == (debug1). **debug0 est la
valeur par défaut. -NUM- window == (inDefaut = 'NumberIn'). ** NUM :
number, fonctionne uniquement pour le Delaf. -EXC- form == (1,0). |
3. Spécificiation des sorties (2 p.)
Comme on l'a présenté plus haut, Lextoh permet de suivre le flot de traitement de la sortie native à la sortie finale par le mode avancé. Dans le mode normal, on affiche uniquement la sortie finale.
C'est le résultat original du lemmatiseur appelé, sans aucune modification. Pour le Delaf, la sortie native est une requête MySQL. On la transmet dans un tableau pour l'afficher sur l'interface.
Voici deux sorties natives (xip et Delaf) pour bonjour, tu vas bien ?.
La sortie brute est un tableau (Array). Dans cette étape, le système uniformise les clés (ex. lang, form, pos, allTag, start et end) pour l'étape suivante (sortie en forme lemmatix). Pour cette uniformisation, nous pouvons utiliser Tracompl pour décrire les règles de transformation. Pour l'instant, nous avons fait de façon ad hoc. Le système garde encore toutes les informations de la sortie native. Voir l'exemple ci-dessous.
Figure 106 : Exemple d'une sortie brute |
c. Langage Lemmatix
Avant de parler du format suivant (le format informatisé), on présente d'abord la forme (ou le langage) Lemmatix, utilisée dans Lextoh, pour normaliser les sorties des différentes formes possibles. La normalisation porte sur les noms et les valeurs des attributs. La syntaxe de Lemmatix est décrite en Xml. On présente sa DTD dans la figure suivante.
<!DOCTYPE LEMMATIX [ <!ELEMENT LEMMATIX
(lexeme*)> <!ELEMENT lexeme (entry*)> <!ELEMENT entry
(lemma,pos,morpho-tag-list)> <!ELEMENT lemma (#PCDATA)> <!ELEMENT pos (#PCDATA)> <!ELEMENT morpho-tag-list
(morpho-tag?)> <!ELEMENT morpho-tag
(#PCDATA)> <!ATTLIST LEMMATIX syst CDATA
#REQUIRED> <!ATTLIST LEMMATIX lang CDATA
#REQUIRED> <!ATTLIST lexeme startpos CDATA
#REQUIRED> <!ATTLIST lexeme endpos CDATA
#REQUIRED> <!ATTLIST lexeme form CDATA
#REQUIRED> <!ATTLIST lemmat confidence
CDATA #IMPLIED> <!ATTLIST lemmat type CDATA
#IMPLIED> <!ATTLIST pos confidence CDATA
#REQUIRED> ]> |
|
Figure 107 : Lemmatix.DTD
Pour des raisons d'implémentation informatique, on a conçu deux sous-formes. La sous-forme lemmatix intermédiaire et la sous-forme lemmatix finale sont toutes les deux conformes à lemmatix.dtd.
d. Sortie en lemmatix intermédiaire
Les valeurs de la forme intermédiaire sont des valeurs
directes qui sont extraites des différents
lemmatiseurs. Par exemple :
GNR(MASC,FEM) → <morpho-tag>MASC,FEM<morpho-tag>.
|
|
Figure 108 : Deux exemples de lemmatix intermédiaire
e. Sortie en Lemmatix finale
Les valeurs de la forme finale sont des valeurs traitées et
uniformisées des différents lemmatiseurs.
Par exemple :
<pos>+nom</pos> → <pos>noun<pos>.
Pour
unifier les résultats de différents analyseurs morphologiques, nous
avons utilisé le standard ISOcat
DCR [ISOcat, 2008].
f. Sortie finale (résultat de filtrage)
Le système produit différentes sorties finales. Chaque
sortie finale est une combinaison de format+formalisme. Voir le paragraphe
Entrées et Sorties au IV.2.2.1.
Annexe
11
Spécifications de CreatDico
La conception de CreatDico ressemble beaucoup à celle de Lextoh.
1. Configurations et descripteurs des outils utilisables (0,5 p.)
Comme pour Lextoh, on a un fichier "RESSOURCE"
pour décrire les outils utilisables par langue ou par outil. Par exemple :
<!-- Ressources connues de CREATDICO, par langue --> <RESSOURCES
dateCreation = "20140222" dateDerniereModif = "20151208"
Auteur =
"Ying" Accessible = "Public"> <!-- Services de dictionnaires --> <SERVEURS> <SERV codeServ = "Papillon"
codeEnt = "utf8" callType="API" url = "http://www.papillon-dictionary.org/papillon/api/$dico/$lang/cdm- headword/$headword/cdm-translation?strategy=EQUAL"
/>
<SERV codeServ = "Pivax"
codeEnt = "utf8" callType="API" url = "http://getalp.imag.fr/pivax/api/$dico/$lang/link/manger ?strategy=EQUAL" />
<SERV codeServ = "Pivax"
codeEnt = "utf8" callType="EXEC" url = " http://iate.europa.eu"
requete="php -f Robodico.PHP LS=$ls LC=$lc lemme=$text" />
</SERVEURS> <!-- LANGUES --> <LANGUE codeLG = "ZHO">
<DICO codeServ = "Papillon"
codeDico = "Cedict" nbrEntries = "215424"/> </LANGUE> <LANGUE codeLG = "ENG">
<DICO codeServ = "Papillon"
codeDico = "Cedict" nbrEntries = "107712"/> <DICO codeServ = "Papillon"
codeDico = "DicoFulUS" nbrEntries = "9997"/> <DICO codeServ = "IATE"
codeDico = "IATE" nbrEntries = "1282712"/> </LANGUE> </RESSOURCES> |
Comme présenté au IV.3.2, nous avons une petite configuration pour chaque sortie dédiée. Cette configuration permet de spécifier les préférences. Par exemple, pour SECTra, nous préférons utiliser xip comme outil de lemmatisation pour le français et l'anglais. Nous avons déjà montré un exemple dans la Figure 91.
2. Spécification des entrées (0,25 p.)
Nous avons mentionné les entrées au IV.3, voici la spécification.
-CHA- text == (inDefaut = 'textIn'). ** -CHA- chaîne de caractères. -EXC- output == (MS, GS, JSON, CCDX, DQ, etc.). ** excusive. -EXC- detail == (0,1). -EXC- lang == (zho, fra, eng, etc.). -NEX- lc == (zho, fra, eng,etc.). **non excusive, 1 ou plusieurs. -EXC- serv == (Pivax, Papillon, IATE, wiktionary, etc.). -EXC- dico == (Papillon:Cedict, Papillon:JMDICT, Papillon:Littre, etc.). -EXC- debut == (0,1). -EXC- form == (0,1). -EXC- lemmat == (Jieba, Ariane-Heloise, etc.). ** Outils dispon sur Lextoh. |
3. Spécification du langage CCDX (Common CreatDico Xml ) (2,25 p.)
Comme Lemmatix pour Lextoh, nous avons utilisé le langage CCDX (Common CreatDico Xml) pour uniformiser et informatiser les différentes sorties natives. Cela nous permet de simplifier les programmes pour construire une nouvelle sortie dédiée (mini-dictionnaire). On transforme d'abord les sorties natives vers les sorties en CCDX, puis on écrit des programmes simples (plugins) pour transformer les sorties en CCDX vers une sortie dédiée. Voici le fichier CCDX.DTD.
<!DOCTYPE CCDX [ <!ELEMENT CCDX (description, dictionnaires*)> <!ELEMENT description (entree, lemmatiseur?)> <!ELEMENT entree (#PCDATA)> <!ELEMENT lemmatiseur (#PCDATA)> <!ELEMENT dictionnaires (forme, dictionnaire*)> <!ELEMENT forme (#PCDATA)> <!ELEMENT dictionnaire (lemme, traductions*)> <!ELEMENT lemme (#PCDATA)> <!ELEMENT traductions (traduction*)> <!ELEMENT traduction (mot-vedette, typeMot?, pronom?, domaine?, def?,
pos?, fiab?, ref?, exemple?, commentaire?)> <!ELEMENT mot-vedette (#PCDATA)> <!ELEMENT typeMot (#PCDATA)> <!ELEMENT pronom (#PCDATA)> <!ELEMENT domaine (#PCDATA)> <!ELEMENT def (#PCDATA)> <!ELEMENT pos (#PCDATA)> <!ELEMENT fiab (#PCDATA)> <!ELEMENT ref (#PCDATA)> <!ELEMENT exemple (#PCDATA)> <!ELEMENT commentaire (#PCDATA)> <!ATTLIST CCDX serv CDATA #REQUIRED> <!ATTLIST CCDX dico CDATA #REQUIRED> <!ATTLIST CCDX langueSource CDATA #REQUIRED> <!ATTLIST entree type CDATA #REQUIRED> <!ATTLIST traductions lang CDATA #REQUIRED> ]> |
Voici un exemple de CCDX.
segment source = porte-bébé, langue source = fra, langues cibles = eng,
esp, outil de lemmatisation = xelda, service dictionnairique = iate.
<?xml version="1.0"
encoding="UTF-8"?> <!DOCTYPE CCDX SYSTEM "CCDX.dtd"> <CCDX serv="iate" dico="iate" langueSource="fra"> <description> <entree
type="txt">porte-bébé</entree> <lemmatiseur>xelda</lemmatiseur> </description> <!--un
forme pour un dictionnaire--> <dictionnaires> <forme>porte</forme> <!--un
lemme pour un dictionnaire--> <dictionnaire> <lemme>porte</lemme> <!--les
traductions d'une langue sont dans un élément « traductions »--> <traductions
lang="eng">
<!-- traduction -->
<traduction>
<mot-vedette>door</mot-vedette>
<pos>NOUN</pos>
<fiab>3</fiab>
<ref_tra>The Land Rover Dictionary</ref_tra>
</traduction>
<traduction>
<mot-vedette>door</mot-vedette>
<domaine>Bâtiment et travaux publics</domaine>
<def>A building component consisting of an object in the
form of a plate, the door leaf, normally equipped with a frame with which an
opening for passage may be closed; normally the passage is shaped so as to
accommodate persons in the upright position</def> <ref_def>Ing.P.Lassen</ref_def>
<fiab>3</fiab>
<ref_tra>Ing.P.Lassen</ref_tra>
<commentaire>Door usually refers to a door leaf. The word
doorset means door leaf plus door frame(S). Swedish and Danish make a
difference between doors for normal traffic (persons) and doors for e.g. motor
vehicle traffic etc. (see gate)</commentaire>
</traduction>
<traduction>
<mot-vedette>gateway</mot-vedette>
<fiab>3</fiab>
<ref_tra>Reg. 3381/94 (1) OJ L 367/94 p.104 Notice (2) OJ C
82/90 p.12</ref_tra> </traduction>
<traduction>
<mot-vedette>gate</mot-vedette>
<def>a region in which the electric field due to the
control gate voltage is effective</def>
<ref_def>IEV 521-7-9</ref_def>
<fiab>3</fiab>
<ref_tra>IEV 521-7-9</ref_tra>
<commentaire>of field-effect transistors; REF:IEV 521-7-9</commentaire>
</traduction> </traductions> <traductions
lang="spa">
<traduction>
<mot-vedette>pasarela</mot-vedette>
....
</traduction>
<traduction>
<mot-vedette>puerta</mot-vedette>
....
</traduction> </traductions> </dictionnaire> <!--autre
lemme de porte--> <dictionnaire> <lemme>porter</lemme> <traductions
lang="fra"> ... </traductions> <traductions
lang="spa"> ... </traductions> </dictionnaire> </dictionnaires> <dictionnaires> <forme>bébé</forme> <traductions
lang="eng"> <traduction>
<mot-vedette>baby</mot-vedette>
.... </traduction> </traductions> <traductions
lang="spa"> .... </traductions> </dictionnaires> </CCDX> |
4. Spécification des formats de sortie (1 p.)
Le système a trois formats pour les sorties générales : Json, Xml-CCDX et txt (chaîne de caractères). On peut aussi en utiliser deux supplémentaires si on a besoin d'informations détaillées. Au total, on a 5 types de sortie : texte-simple, texte-détaillé, Xml-CCDX (il n'existe pas de sortie "simple" pour ce format), Json-simple et Json-détaillé (pas encore réalisé).
On a déjà montré des exemples (interfaces) au IV.3.3.1.
La sortie en texte-simple est sous forme ci-dessous.
Lemme = LemmeSource
Translation = Trans1(Lang) Trans2(Lang)
Souvent, la longueur des informations détaillées est très grande. On a décidé d'afficher la sortie en texte-détaillé en deux étapes. La première étape est des textes bruts sous la forme
Lemme = LemmeSource,
part-of-speech de lemme = POS,
Translation = Trans1, langue
de traduction = Lang1.
Voici les détaillées de traduction (en Xml).
La deuxième étape est le nœud Xml correspondant.
Voici un exemple pour la sortie en Json-simple.
Entrée : hello word var JSONObject=[ {"serv":"wiktionary",
"dico":"wiktionary", "lang":"eng",
"lc":"fra&esp", "lemmat":"xip",
"sortie":"JSON", "detail":"non"}, {"lemme":"hello",
"translation"="bonjour", "langue"="fra"}, {"lemme":"hello",
"translation"="salut", "langue"="fra"}, {"lemme":"hello",
"translation"="allô", "langue"="fra"}, {"lemme":"hello",
"translation"="hola", "langue"="esp"}, ... ] |
Pour les exemples de Xml-CCDX, voir la section précédente.
Les sorties dédiées (plugins) sont construites principalement par les utilisateurs, on en a montré un exemple pour SECTra au IV.3.2.1.
Nous présentons maintenant les contraintes techniques pour le développement des plugins.
5. Contraintes techniques pour le développement (0,5 p.)
En quel langage les plugins pour les sorties dédiées sont-ils écrits ? C'est souvent la première question posée par nos utilisateurs. Notre intergiciel est principalement construit en PHP. Les premiers mini-dictionnaires sont également construits en PHP.
En effet, la construction de mini-dictionnaires concerne principalement des transformations de données en Xml-CCDX vers un autre format demandé par le client, par exemple, le renommage des balises pour un nouveau XML. Pour cette partie, nous avons déjà expliqué au IV.3.3.2.2c.
Pour des raisons informatiques, on doit avoir un fichier PHP pour chaque sortie dédiée dans le répertoire préfixé : CreatDico/_Plugins/. L'entrée de ce fichier est une sortie générale (souvent Xml-CCDX) de CreatDico. La sortie de ce fichier est la sortie dédiée. Nous n'avons pas de contraintes spéciales pour utiliser tel ou tel langage pour réaliser les spécifications.
Par exemple, nous pouvons écrire un programme python pour ces spécifications. Pour l'intégrer dans CreatDico, on procède en deux étapes : (1) créer le fichier PHP dans le répertoire préfixé, (2) appeler le programme python en utilisant le programme suivant.
//Entrée:$XML_CCDX //Sortie:$n_sortie nouvelle sortie dédiée $command = "python /home/ying/lingOutils/minidico/minidico_python.py
$XML_CCDX "; $n_sortie = exec($command); return $n_sortie; |
De la même façon, nous pouvons également réaliser les transformations par un service d'API. Comme Xml_CCDX est long, on a proposé de l'enregistrer dans un fichier. Notre fichier PHP de plugin sera similaire au programme suivant.
//Entrée:$XML_CCDX //Sortie:$n_sortie nouvelle sortie dédiée $file = fopen("temp_file.xml") or die ("Unable to open
file"); fwrite($file, $XML_CCDX); $url = "http://localhost/Ci-Hai/minidico_test/?Sortie_Orig=".urlencode($file); $n_sortie = file_get_contents($url); fclose($file); return $n_sortie; |
Dans nos intergiciels Lextoh et CreatDico, nous avons procédé de cette façon pour récupérer les résultats des différents services.
Par exemple,
· dans Lextoh,
o l'appel à Ariane-Héloïse est réalisé par un plugin appelant curl.
o l'appel à Jieba est réalisé par un plugin écrit en Python.
· dans CreatDico,
o l'appel à Papillon est réalisé par un plugin contenant une commande de l'API.
[1] Alors respectivement chercheur postdoctoral au centre de recherche de NTT à Keihanna, attaché scientifique à l'Ambassade de France à Tokyo, et doctorante en linguistique computationnelle à Paris VI mais travaillant en fait au GETA-CLIPS à Grenoble.
[2] https://groups.google.com/forum/?hl=en#!forum/hownet,
visité en 2015.
[3] Dans
notre expérience, on peut envoyer le fichier entier dans une seule requête.
Mais alors, il faut gérer les files d'attente du côté de Tradoh.
Donc on délègue toutes les gestions de travaux à ActiveMQ,
et on minimise les requêtes (c'est-à-dire que chaque requête peut être executé
directement sur Tradoh).
[4] Ces
sont les mêmes interfaces de JMS (Java Message
Service). JMS est la technique sous jacente d'ActiveMQ.
[5] Ce format est un résultat de négociation, et est construit par l'application émettrice de SECTra. C'est le contenu du message. Par exemple,
String msg = segment+
"|zho|fra|Google|"+id_segment ;
TextMessage message = session.createTextMessage(msg);