Annexes

Annexe 1       Liste d'une partie des ressources lexicales

Voici une liste des ressources lexicales informatisées, téléchargeables et gratuites, trouvées sur Internet.

Nom

Brève description

Nbr d'entrées

Langues

URL

Apertium

218 dictionnaires monolingues en 93 langues différentes,

236 dictionnaires bilingues en 235 couples de langues différents

Plus de 3,8M pour dictionnaires monolingues.

Plus de 2,5M pour dictionnaires bilingues


 

http://wiki.apertium.org/wiki/List_of_dictionaries

https://sourceforge.net/projects/apertium/files/

CC-Cedict

Un dictionnaire de zho→eng.

114K

zho→eng

https://www.mdbg.net/chindict/chindict.php?page=cedict

CFDICT

Un dictionnaire de zho↔fra

6240

zho↔fra

http://www.chine-informations.com/mandarin/open/CFDICT/

DELAF

 

Lexique des formes fléchies du français et de l'anglais.

Dictionnaire du français : 683K entrées simples pour 102K lemmes différents et 108K entrées composées pour 83K lemmes différents.

Dictionnaire de l'anglais : 296K entrées simples pour 150K lemmes différents et 133K entrées composées pour 70K lemmes différents

eng, fra

http://infolingu.univ-mlv.fr/DonneesLinguistiques/Dictionnaires/telechargement.html

DiLAF

Base lexicale contributive conllaborative pour les dictionnaires de langues africaines vers le français.

bam : 10 800

hau : 7238

kan : 6000

thm : 6100

dje : 6914

bam→fra,

hau→fra,

kan→fra,

thm→fra,

dje→fra

http://www.dilaf.org/dilaf/Home.po

GLÀFF

Un lexique du français à large couverture extrait du Wiktionnaire, le dictionnaire collaboratif en ligne

2M

fra

http://redac.univ-tlse2.fr/lexiques/glaff.html

IATE

Une grande base terminologique.

8M

25 langues européennes

http://iate.europa.eu/tbxPageDownload.do

Jibiki.fr

Base lexicale contributive collaborative pour dictionnaire fra-jpn.

Trois ressources disponibles : Cesselin, JMdict, Kanjdic

153 897

jpn, fra, eng

http://jibiki.fr/data/

JMdict

Dictionnaire japonais-anglais et autres langues par Jim Breen

173K

jpn→

eng,fra,esp,

por,deu,rus,

nld

http://www.edrdg.org/jmdict/j_jmdict.html

Kaifangcidian

Quatre dictionnaires : zho→nor, nor→zho, zho→epo, epo→zho

zho→nor : 2544

nor→zho : 3469

zho→epo : 6313

epo→zho : 5492

zho↔nor, zho↔epo

http://kaifangcidian.com/xiazai/nuo/

http://kaifangcidian.com/xiazai/shi/

LEFFF

Lexique des formes fléchies du français.

Nombre de formes : 404 634

Nombre de lemmes : 105 595

fra

http://www.labri.fr/perso/clement/lefff/

Littré

Dictionnaire monolingue français

136K

fra

http://www.littre.org/faq

Morphalou

Lexique des formes fléchies du français.

Nombre de formes : 524 725

Nombre de lemmes : 95 810

fra

http://www.cnrtl.fr/lexiques/morphalou/

MotÀMot

Base lexicale contributive conllaborative pour un dictionnaire fra↔khm.

13 249 articles français avec traductions en khmer.

23 766 articles khmer avec traductions en français.

32 402 liens bilingues français-khmer.

fra↔khm

http://jibiki.univ-savoie.fr/motamot/Download.po;jsessionid=ivcrZwUlAQHW-L9LomhO0jJN

ProLMF

Ressource de Prolexbase.

Lexique relationnel multilingue de noms propres

Nombre de pivots : 73 365

Nombre de relations : 72 604 (3 908 accessibilités, 67 417 méronymies et 1 279 synonymies)

Nombre d'entrées lexicales en français : 96 800 (75 501 noms propres et 21 299 dérivés, soit 147 518 formes)

Nombre d'entrées lexicales en anglais : 19 449 (19 355 noms propres et 94 dérivés, soit 19 449 formes)

Nombre d'entrées lexicales en polonais : 39 020 (35 937 noms propres et 3 083 dérivés, soit 165 309 formes)

10 langues (principalement fra, eng, pol)

http://www.cnrtl.fr/lexiques/prolex/

WaDoku

Dictionnaire japonais-allemand par Ulrich Apel

280K

jpn→deu           

http://www.wadoku.de/wiki/display/WAD/Downloads+und+Links

Webster's

Dictionnaire monolingue anglais Webster's de 1913

182 700

eng

http://www.gutenberg.org/ebooks/29765

Wiktionary

Le dictionnaire multilingue contributif le plus connu au monde.

4 683 963

Plus de 100 langues

http://dumps.wikimedia.org/backup-index.html

WordNet

Grande base de données lexicale pour l'anglais.

147 278

eng

https://wordnet.princeton.edu/wordnet/download/current-version/


Annexe 2       Exemple de diversité des UW dans le projet UNL (1 p.)

Exemple du mot "access" dans différents dictionnaires d'UW.

U++C

access(icl>recover>do, agt>thing, obj>thing);

Cat : VERB;

Déf . : obtain or retrieve from a storage device; as of information on a computer;

 

access(icl>reach>do, agt>thing, obj>thing);

Cat. : VERB;

Déf. : reach or gain access to;

Ex. :

"How does one access the attic in this house?";

"I cannot get to the T.V. antenna, even if I climb on the roof";

UNLKB

right(icl>abstract thing)

  access(icl>right)

way(icl>abstract thing)

  abandon(icl>way)

  access(icl>way)

opportunity(icl>time)

  access(icl>opportunity)

  market(icl>opportunity)

enter(agt>person,obj>thing)

  access(icl>enter(agt>person,obj>thing))

  barge in(agt>person,obj>thing)

  open(agt>thing,obj>thing)

  access(icl>open(agt>thing,obj>thing))

reach(agt>thing,obj>thing)

  access(icl>reach(agt>thing,obj>thing)

  use(agt>thing,obj>thing)

  access(icl>use(agt>thing,obj>thing))

  build(icl>use(agt>thing,obj>thing))

  drive(icl>use(agt>thing,obj>thing))

UNLDeco/UNL-FR

[accéder] {CAT(CATV),AUX(AVOIR),VAL1(GN),GP1(A)} "access(agt>thing,obj>thing)";

EOLSS/UNL-FR

access(icl>use(agt>thing,obj>thing))


Annexe 3       Historique du projet Papillon (1 p.)

(Ce qui suit est un résumé par Ch. Boitet de diverses présentations).

Le projet Papillon [Tomokiyo, M. et al., 2000] a été lancé en juillet 2000 par Emmanuel Planas, François Brown de Colstoun et Mutsuko Tomokiyo[1], avec le concours de F. Andrès, U. Apel, V. Bellynck, Ch. Boitet, J. Breen, M. Mangeot, G. Sérasset, M. Zock, K. Kageura, M. Lafourcade, etc. La motivation principale du projet était qu'il y a très peu de ressources dictionnairiques français↔japonais, et que ces ressources ne sont pas informatisées. Les dictionnaires disponibles sous forme papier sont chers et difficiles à utiliser par les apprenants, à cause du manque de transcription phonétique et d'autres informations cruciales pour les étrangers, comme les classificateurs et quantificateurs. Le but du projet était de créer un environnement de développement coopératif à travers Internet et de créer une grande base lexicale multilingue. Il s'agissait initialement du français, du japonais et de l'anglais.

Les premières années du projet, de 2000 à 2006, il y eut un séminaire par an. Le séminaire de lancement du projet Papillon eut lieu en août 2000 au NII, à Tokyo. Il fut décidé de développer non pas une, mais deux bases lexicales multilingues, Papillon-CDM et Papillon-NADIA, décrites au I.1.3.2.3. Le second séminaire (juillet 2001, Grenoble) fut surtout consacré à des décisions techniques et organisationnelles, au vu du fonctionnement durant la première année. Le séminaire de 2002 fut organisé en juillet à Tokyo. Il y fut décidé que toutes les ressources de ce projet seraient mises en "source ouvert" (open source), sous licence Creative Commons. On discuta aussi des ressources financières et des façons de construire la  base. En juillet 2003, le séminaire fut accolé à ACL-2003, à Sapporo. On y discuta de la plate-forme logicielle utilisée pour la construction de la base lexicale.  Le séminaire de 2004 fut organisé en août à Grenoble sous la forme d'un post-workshop (Multilingual Linguistic Ressources, MLR2004) de COLING-2004, qui avait lieu à Genève. En 2005, le séminaire fut organisé en décembre à Chiang Rai, Thailande. Le dernier eut lieu en juillet 2006 à Bangkok, en liaison avec celui du STIC-Asie-NLP, juste avant COLING-2006.

Depuis 2006, la base lexicale est maintenue en service par M. Mangeot et est utilisée pour de la consultation, et de temps en temps pour de la contribution. Contrairement aux attentes initiales, il n'y a pas de contributions "isolées" par des contributeurs opportunistes. Par contre, quand quelqu'un ou un groupe a produit un dictionnaire intéressant, il lui est facile de le faire intégrer la base.

Il faut en particulier noter le projet GDEF (Grand Dictionnaire Estonien Français) [Mangeot, M. & Chalvin, A., 2006], supporté depuis plus de 10 ans par une instance particulière de Papillon. Un petit groupe de Français et d'Estoniens y travaille tous les jours.


Annexe 4       Questions et réponses sur HowNet[2]  (18 p.)

Ce qui suit est tiré d'échanges passionnants avec le Pr. Dong Zhen Dong (en chinois), qui a créé et continue à augmenter HowNet avec quelques collaborateurs, depuis 1988.

Aupararant, il avait participé au projet KY-1, un système TA zh↔en, développé par l'académie des sciences militaires entre 1982 et 1987. En 1988, ce système a été renommé TRANSTAR, le premier système commercial de TA en Chine [Dong, D. Z., 1990 ; Dong, D. Z., 2007].

1. Is HowNet a WordNet-like lexical database?

No. HowNet is not a WordNet-like lexical database. HowNet is completely different from WordNet both in its philosophy and implementation. WordNet is an online lexical database, while HowNet is a common-sense knowledge system with concepts as its basis. HowNet is purely computer-oriented.

 

2. What is HowNet most prominent feature?

HowNet most prominent feature is its unique way to define the concepts denoted by the lexical units in its basic database.

For example,

In HowNet:

cf. WordNet:

buy

1.   DEF={buy|}

2.   DEF={GiveAsGift|:manner={guilty|有罪},purpose={entice|勾引}}

buy

1.   (594) buy, purchase – (obtain by purchase; acquire by means of a financial transaction;)

2.   (7) bribe, corrupt, buy, grease one's palms – (make illegal payments to in exchange for favors or influence;)

Buyer

1.   {human|:domain={commerce|},{buy|:agent={~}}}

Buyer

1.   buyer, purchaser, emptor, vendee – (a person who buys)

HowNet concepts or senses are defined in a structured language called Knowledge Data Mark-up Language (KDML), which is composed of two basic elements and a set of symbols as its operators.

sememes: buy|, GiveAsGift|, guilty|有罪, entice|勾引, human|, commerce| ...

semantic relations: manner, purpose, domain, agent...

operators: {}, =, :, ~ ...

 

3. What is the current size of HowNet basic database?

Current general statistics are as follows (25/01/2016) :

Chinese characters

20 892

20 892

Chinese words & expressions

122 078

125 022

English words & expressions

111 945

116 641

Chinese meanings

138 957

142 485

English meanings

132 369

137 566

Definition

32 137

33 268

Record

220 790

226 860

4. Then what is the current size in terms of syntactic and semantic categories?

Syntax                                   

 

Semantics

PartOfSpeech

English

Chinese

 

PartOfSpeech

English

Chinese

adj

12 599

13 721

 

Entity

4

3

adv

3 122

2 433

 

Event

14 799

15 558

aux

101

103

 

Attribute

5 201

4 665

char(acter)

0

14 405

 

AttributeValue

10 967

10 860

classifier

0

447

 

Thing

94 579

94 593

conj

85

135

 

Time

2 872

2 872

coor

7

14

 

Space

1 427

1 427

det

123

58

 

Component

9 208

9 209

echo

7

137

 

 

 

 

expr(ession)

1 000

850

 

 

 

 

infs

7

0

 

 

 

 

letter

57

57

 

 

 

 

noun

66 823

61 712

 

 

 

 

num(eral)

572

557

 

 

 

 

pp

1 372

0

 

 

 

 

prefix

28

7

 

 

 

 

prep

320

257

 

 

 

 

pron

109

176

 

 

 

 

pun

50

45

 

 

 

 

root

3 233

0

 

 

 

 

stru

0

82

 

 

 

 

suffix

7

0

 

 

 

 

verb

27 415

32 620

 

 

 

 

wh

87

48

 

 

 

 

Categories:

木,林,,梨,桃,李,森,枝,茶,杈,,梁,

医院,医生,医,医,医士,医患,医德,医,医,医

 

5. What does a RECORD look like in HowNet basic database?

As described in Q3, HowNet currently includes over 220 000 records in its database. In HowNet each word or expression is written in the form of a record. A record is composed of the following items:

NO.=

serial number

W_C=

Chinese word or expression

G_C=

Chinese grammatical information

S_C=

Sentiment information for Chinese

E_C=

Examples for Chinese

W_E=

English word or expression

G_E=

English grammatical information

S_E=

Sentiment information for English

E_E=

Examples for English

DEF=

Definition of the concept

RMK=

Remarks

Some records are shown below.

NO.=047395

W_C=动脉硬化症

G_C=noun [dong4 mai4 ying4 hua4 zheng4]

S_C=MinusEntity|负面实体

E_C=

W_E=atherosclerosis

G_E=noun [2 atherosclerosisnoun-0static,uncount]

S_E=MinusEntity|负面实体

E_E=

DEF={disease|疾病:scope={part|部件:PartPosition={nerve|},whole={part|部件:PartPosition={viscera|},whole={AnimalHuman|动物},{circulate|循环:instrument={~}}}}}

RMK=Atherosclerosis comes from the Greek words athero (meaning gruel or paste) and sclerosis (hardness).

NO.=162300

W_C=

G_C=verb [wen4]

S_C=

E_C=

W_E=ask

G_E=verb [2 askverb-0vt,dobj,sobj,whobj,ofnpa22    ]

S_E=

E_E=

DEF={ask|}

RMK=

NO.=128941

W_C=请求

G_C=verb [qing3 qiu2]

S_C=

E_C=

W_E=ask

G_E=verb [3 askverb-0vt,sobj,tocomp,thatobj,ofnpa23    ]

S_E=

E_E=

DEF={request|要求}

RMK=

 (Note the difference between two "ask" in their grammatical information)

NO.=142804

W_C=适销对路

G_C=adj [shi4 xiao1 dui4 lu4]

S_C=PlusSentiment|正面评价

E_C=

W_E=salable

G_E=adj [3 salableadj-0endmore,prepo1     ]

S_E=PlusSentiment|正面评价

E_E=

DEF={suitable|适宜:domain={commerce|商业},scope={sell|:possession={$}}}

RMK=

 

6. If I search with some semantic feature(s), can I extract all the words with the specified feature(s) from HowNet? If I can, how should I do?

Yes, you can. Look at HowNet Browser and you will find the following dialogue boxes which function with the search: KeyWord, Language, and search Mode at the Browser bottom line, the selection result may be shown as follows: exact, first, fuzzy, etc.

Take the English word "patient" for example.

Input the word "patient" into KeyWord and choose "exact" for search mode.

KeyWord:  patient      Language:  Automatic     exact

Then choose the first sense:

DEF={human|:domain={medical|},{SufferFrom|罹患:experiencer={~}}, {doctor|医治:patient={~}}}

Then choose the whole DEF as a semantic feature and input it, and select "first" as search mode.

KeyWord:  "{human|:domain={medical|},{SufferFrom|罹患:experiencer={~}}, {doctor|医治:patient={~}}}"      Language:  feature     first

Then the Browser will show the statistical results at the right-hand corner: 8 DEF(s) found and 52 record(s) found.

Now take {SufferFrom|罹患:experiencer={~}} as value of the KeyWord, and fuzzy as search mode.

KeyWord:  "{SufferFrom|罹患:experiencer={~}}"  Language:  feature     fuzzy

Then the Browser will also show the statistical results at the right-hand corner: 23 DEF(s) found and 80 record(s) found.

If we want to extract and export all the records of the search results, we place the cursor at the result box and right-click. We then see a menu, choose "Export Search Result(full)", and "Export Search Result(Chinese words)" or "Export Search Result(English Words)".

Some of the 80 records of the search results are exported and shown below.

NO.=140765

W_C=失语症患者

G_C=noun [shi1 yu3 zheng4 huan4 zhe3]

S_C=MinusEntity|负面实体

E_C=

W_E=aphasic

G_E=noun [2 aphasicnoun-0static    ]

S_E=MinusEntity|负面实体

E_E=

DEF={human|:{SufferFrom|罹患:content={disease|疾病:scope={speak|}},experiencer={~}}}

RMK=

NO.=120276

W_C=陪床

G_C=verb [pei2 chuang2]

S_C=

E_C=

W_E=stay in a hospital ward to look after a patient

G_E=verb [51stayverb-0vi      ]

S_E=

E_E=

DEF={stay|停留:location={room|房间:domain={medical|},{doctor|医治:location={~}}},purpose={TakeCare|照料:patient={human|:domain={medical|},{SufferFrom|罹患:experiencer={~}},{doctor|医治:patient={~}}}}}

RMK=

NO.=201564

W_C=主诉

G_C=noun [zhu3 su4]

S_C=

E_C=

W_E=chief complaint

G_E=noun [52complaintnoun-0      ]

S_E=

E_E=

DEF={text|语文:RelateTo={human|:domain={medical|},

{SufferFrom|罹患:experiencer={~}},

{doctor|医治:patient={~}}},

{ExpressDissatisfaction|示不满:instrument={~}}}

RMK=

NO.=181525

W_C=医嘱

G_C=noun [yi1 zhu3]

S_C=

E_C=

W_E=doctor's advice

G_E=noun [52advicenoun-0      ]

S_E=

E_E=

DEF={text|语文:domain={medical|},

{propose|提出:agent={human|:{doctor|医治:agent={~}}},content={~},

target={human|:{SufferFrom|罹患:experiencer={~}}}}}

RMK=

NO.=040849

W_C=担架

G_C=noun [dan1 jia4]

S_C=

E_C=

W_E=stretcher

G_E=noun [2 stretchernoun-0static    ]

S_E=

E_E=

DEF={tool|用具:domain={medical|}, {transport|运送:instrument={~}, patient={human|:domain={medical|},{SufferFrom|罹患:

experiencer={~}},{doctor|医治:patient={~}}} {human|:{wounded|受伤:experiencer={~}}}}}

RMK=

NO.=151072

W_C=探病

G_C=verb [tan4 bing4]

S_C=

E_C=

W_E=visit a patient

G_E=noun [51visitverb-0vi      ]

S_E=

E_E=

DEF={visit|看望:content={human|:domain={medical|},{SufferFrom|罹患:experiencer={~}},{doctor|医治:patient={~}}}}

RMK=

 

7. Are you developing any HowNet-based machine translation systems?

Yes, we have recently built a HowNet-based English-to-Chinese MT system, named HowNet MT. The system is a rule-based and semantic-enhanced system. As the system employs much common-sense knowledge and semantics, its translation quality is incredibly good, much better than the free MT systems on the web. The system is composed of three parts: HowNet Knowledge-base, English syntactic and semantic analysis subsystem, and Chinese synthesis subsystem. The English analysis subsystem can be used on its own as an English parser to meet other NLP demands.

 

8. What is the HowNet-based tool called Sense_Colony_Tester and what tasks can it be applied to?

Each kind of bacteria has its own colony based on the same morphology. Similarly, each concept has its own colony. HowNet-based Sense_Colony_Tester (SCT) can represent and thus display the relevancy of a concept, or sense, to the other concepts in a given context.

SCT is bilingual, English or Chinese. Let's look at the following demo. Suppose your text to be tested is:

“I usually have bread and butter and homemade jam for breakfast.”

After you input your text into the "Source Text" Box, and select English or Chinese and then click "submit".

Figure 92 : HowNet Interface 1

 

In the "Result Tree" box, all the concepts or senses of the given text will be shown. We call this processing a text-CT, as shown by Fig. 2. If only words rather than concepts or senses can be displayed, it is called text-X-ray as shown by Figure 92.

Figure 93 : HowNet Interface 2

SCT critical function is to give two statistical results: (1) Relevancy Count for every concept of the words in the tested text; (2) Distance Value of every concept from its immediate relevant neighbour.

Figure 94 : HowNet Interface 3

Therefore, SCT can be applied to WSD, especially for those types of discourse ambiguities. SCT is employed in the HowNet-based machine translation system. Figure 94 shows SCT will choose the sense of "eat" for the word "have", cf. Figure 95 And Figure 96 shows SCT will choose the sense of "food" for the word "jam", cf. Figure 97. The relevancy count of the sense of food in the word "jam" is 0004, which is the highest of its three senses. We suppose you may know what senses are the voters for this: "eat", "drink" of the word "have", and "food" of "bread and butter" and "eat" in the word "breakfast".

Figure 95 : HowNet Interface 4

 

Figure 96 : HowNet Interface 5

 

Figure 97 : HowNet Interface 6

SCT can also serve as an effective tool for tasks based on meaning computation, such as text summarization, text topic identification, text categorization, etc. Figure 98, Figure 99 and Figure 100 show that the topic of the given text may be some kind of medicine and its relatedness to a symptom and infection, the statistical results of the concepts, the following concepts enjoy higher priority in Relevancy Count (more than 0010).

 

Medicine:

0024 (0025)

Treat:

0017

Symptom:

0024

Infection:

0018

Cell:

0024

Fungus:

0012

Skin:

0022

Cell membrane:

0012

 

 

Figure 98 : HowNet Interface 7

 

Figure 99 : HowNet Interface 8

Figure 100 : HowNet Interface 9

 

9. I have a question on English; I think a native speaker will answer it. My questions are:

What are the correct or accurate English questions for the following statements:

(1) I kicked him in/on the leg.  – "Where did you kick him?" It seems inaccurate.

(2) He signed his name at the right lower corner. "Where did he sign his name?" It also seems inaccurate.

In Chinese there are two different kinds of questions which we can distinguish:

你在哪踢了他?(Where did you kick him?) – in the playground

你把他哪踢了?(You kicked him where?) – in the leg

他在哪签了他的名字?(Where did he sign his name?) – in the office

他把名字签在哪了?(He signed his name where?) – at the right lower corner

Or in English the questions of the kind are ambiguous themselves.

Our friend Thomas Yale answered my questions as follows.

To answer your question, this is another way English is more ambiguous than Chinese.

(1) For the question "Where did you kick him?" the answer "I kicked him in/on the leg" seems the most reasonable in one's mind in English, but it could be answered with a particular place: "I kicked him in my apartment."

(2) The same case for "Where did he sign his name?"  The most reasonable contextual answer in English is "He signed his name at the right lower corner (of the document)" but could also be answered "He signed his name at the law office" or even "He signed his name in Quebec", although we would regard both the latter geographical places as one being within another, and the anatomical place, which is a body part, can move and be anywhere.

Consider this significance, however.  It appears that the verb in the question implies the kind of place that is to be understood.  Compare "Where did you kick him?" which implies which body part, with "Where did you take him?" which implies a geographical place.

Because, you see, the definitions (DEFs) in HowNet that "kick" is defined with the single sememe "kick", and "take" (the definition that applies with the above sentence, one translation I think is dai4 ru4) is defined as "guide".  Significantly, the two words are in different places in the Event taxonomy: "kick" is listed under "AlterForm" / "AlterAppearance" / "AlterAttribute" and "guide" is listed under "CauseToDo" / "MakeAct".

So perhaps this is the key to solving this problem of translation: the fact that they do occupy different places in the taxonomy is the basis to deduce what kind of place (anatomical, geographical, or maybe other kinds of places) expected from the answer is most reasonable, or is anticipated in the answer.

From your examples it appears that Chinese avoids this ambiguity in its syntax, by placing interrogative pronouns (like "where", perhaps others?) in a different place among the words in the sentence:

·      你在哪踢了他? ("Where you kick+past him?") as opposed to "You kicked him where?" 

·      The same with他在哪签了他的名字?("Where he sign+past his name?") as opposed "He signed his name where?"

 

10. What are the features specified for English words in HowNet Dictionary? [features total 135]

Apart from POS, the following features are specified and allotted in the five domains of each English word or MWE in the square brackets. Here they are.

 

1. 1st domain – word structural information

The numbers represent: [7]

[1+(space)+single word token ("1" – most high-frequency sense)

[2+(space)+single word token ("2" – more high-frequency sense

[3+(space)+single word token ("3"– general high-frequency sense)

[7+(space)+single word token ("7" – never-chosen for E-C MT

[4+(1~10/11/12...)+head of MWE ("4" – most high-frequency sense)

[5+(1~10/11/12...)+head of MWE ("5" – general frequency sense

[6+(1~10/11/12...)+head of MWE ("6" – never-chosen for E-C MT

(1~10/11/12...)  represents the place of the head in the MWE

 

2.         2nd domain – POS information [17]

noun

pron

verb

adj

adv

num

det – determiner (the)

aux – auxiliary verb (be, have, do, can, may…)

wh – wh-words (who, when, as, though)

conj – coordinate conjunctions

prep – prepositions (in, for, according to, on behalf of…)

pp – preposition phrase (on bad terms…)

infs – infinitive sign (to, in order to, so as to)

expr – an expression, syntactically independent

echo – a sound

prefix

suffix

 

3.         3rd domain – Word-ending information: [11]

-0   //normal word

-s (children)  // special plural

-0s (police)  // no plural or invariable plural

-v (wrote)  // special past form

-ed (bought) //special  -ed (past)

-en (written) //special -en (past participle form)

-ing (feeling, meeting)

-ings

-aaa (put)  //strong verb with 3 same forms: present – past – past participle

-aba(come-came-come) // present = past participle

-aab (beat-beat-beaten) //present = past

 

4.         4th domain – syntactic information [4]

neg – negative (no, none…)

present – present time

past – past time

future – future time

 

4.1      Word/MWE form information: [6]

fup – first letter in upper-case

aup – all letters in upper-case

acro – acronym

endthat – MWE ending in "that" (it is said that,

endprep – MWE ending in a preposition (be confident in, rely on…)

endto – MWE ending in an infinitive-to (be determined to)

 

4.2      for nouns: [9]

action – action noun

ofnpa – in "action-noun + X": X normally as its patient

ofnag – in "action-noun + X": X normally as its agent

static – static noun

uncount – uncountable noun

unit – a unit (meter, foot, gram…)

proper – a proper noun (Canada, Tokyo, Obama, IBM…)

nomodinoun – almost never used to modify a noun (means)

moneysign – a moneysign ($,..)

 

4.3      for numerals [19]

ordi – ordinal (first, 2nd, tenth…)

card – cardinal (1, two, million…)

predet – can come before determiners (all, both, either, none of)

singular – singular (1)

plural – plural (2,10,100…)

indef – indefinite amount (some)

demo – demonstrative (this, those)

date – indicates  "date" (1- 31)

hour – indicates  "hour" (1- 24)

minute – indicates  "minute" (1 - 60)

bage – indicates  "baby's age" (1 - 3)

tage – indicates  "troddler's age" (4 - 5)

cage – indicates  "child's age" (6 - 9)

tnage – indicates  "teenager's age" (10 - 15)

yage – indicates  "youth" (16 - 41)

mage – indicates  "middle-age" (42 - 69)

oage—indicates  "old age" (70 -112)

1digit – indicates one-digit number (1, 2, 3… 9)

2digit – indicates two-digit number (10, 11, 12… 99)

3digit – indicates three-digit number (100, 101, 110… 999)

4digit – indicates four-digit number (1000, 1001, 1110… 1999)

 

4.4      for pronouns [5]

accusat – accusative case (him)

nominat – nominative case (we)

reflex – reflexive (oneself)

singular – singular

plural – plural

 

4.5      for verbs:[15]

vt – transitive

vi – intransitive

copula – copula

linkall – copula which can take n/adj/ved/ven as its complement (be)

linkadj – copula which can take adj/ved/ven as its complement (get)    

sobj – can take a single obj (destroy)

dobj – can take a double obj (give)

ingobj – can take a Ving obj (start, keep, stop…)

thatobj – can take a that-clause as its obj (say)

whobj – can take a wh-clause as its obj (ask)

toobj – can take an to-infinitive-verb as its obj (want)

nouncomp – can take a noun as its complement (call)

tocomp – can take an to-infinitive-verb as its complement (ask)

adjcomp – can take an adj as its complement (paint)

ingcomp – can take a ving as its complement (keep)

 

4.6      for adjectives: [5]

ender – for adj/adv takes "-er" ending when in comparative

endmore – for adj/adv takes more" when in comparative

prepo – usually comes before the element it modifies

postpo – usually comes after the element it modifies

infmodi – often followed by an infinitive phrase (difficult, eager…)

 

4.7      for adverbs: [7]

ender – for adj/adv takes "-er" ending when in comparative

endmore – for adj/adv takes more" when in comparative

minf – can be used to modify infinitives (merely, just…)

mnum – can be used to modify numerals (only, about, just…)

madjonly – can only be used to modify adjectives

sentent – usually used as a sentential adverb (it be said that)

nomverb – never used to modify verbs to its left (more than)

 

4.8      for conjunctions: [3]

conjand – conjuction "and"

conjbut – conjunction "but"

conjor – conjunction "or"/'nor'

 

4.9      for infinitive sign: [TM/2]

infw – single word (to)

infp – MWE (in order to, ready to, so as to…)

 

4.10    for auxiliaries: [6]

auxdo  auxiliary "do"

auxheve  auxiliary "have"

auxbe  auxiliary "be"

modal  modal auxiliaries (can, may, should, would rather…)

tense  tense auxiliaries (will, would, shall, should)

quasiaux quasi-auxiliaries (may just as well, be more likely to)

 

4.11 for wh-words: [7]

question – can be used as a question-word (who, which,why…)

objclaus – can introduce an object clause (which, what, if…)

whinf – can introduce an infinitive-phrase (how, which, what…)

person – a person (who)

advsubj – can be the subject of the clause (who, which, that…)

anonsubj – can not be the subject of the clause (why,)      

adverbial – can introduce an adverbial clause (though, if…)

 

4.12 for prepositions or pp: [3]

advb – mostly used to be an adverbial (during, by…)

attr – mostly used to be an attributive (like, regarding…)

ingpred – when a ving after it, ving mostly is a quasipredicate (by…)

  

4.13 for punctuations: [9]

symbolic – a symbolic (&, #...)

fullstop – fullstop (“.”. “…”)

quesmark – question mark (?)

bracket – brackets (“”, (, )

hyphen – hyphen (-)

comma – comma (,)

colon – colon (:)

title – (#)

semicolon – (:)

 

 

 

 

5. 5th domain – Chinese-transfer information

In fact, the information is for Chinese equivalents

For example,

specific classifiers for nouns (...);

Chinese function words for verbs in passive (加以...) with "" ending for adverbs.

 

11. What are the logico-semantic relations used in HowNet Translation System?

They are as follows:

00        title

目、标题

02        ExtraSentence

句外成分 (sentential adverbs, like: Frankly speaking, in a word.)

03        sentential

句副(如:一般情况下)

04        comment

评论性短(如:众所周知)

05-1    SincePeriod

起自段(近年来,近十年来,四年来,些年来..

05-2    SincePoint

起自  (建国以来,从小,自从他出国以..)

06        DurationBeforeEvent

前耗  (不到三年就成名了)

07-1    TimeAfter

之后

07-2    TimeBefore

之前

08        concession

步(如:尽管、然)

09        condition

条件(如:如果、要是)

10-1    attrcl

从句

10-2    advcl

从句

20-1    agent

施事

20-2    experiencer

经验

20-3    relevant

关系主体

20-4    possessor

有者

20-5    coagent

合作施事

22         byagent

-施事

24        time

时间

26         location

28        negfre

否定率(如:从不)

30         demo

指示(如:、那种)

32        quantity

数量/次第

34        also

也(如:她也来了)

36        emphasis

强调绝对

38        will

意志(如:他也会来)

40        neg

否定

42-1    must

42-2    seem

似乎

42-3    able

44        frequency

48        cause

由、原因

50        source

来源(从买书了一本

52-1    LocationThru

经过处

52-2    EventProcess

事件经过

54        scope

56-1    AccordingTo

根据

56-2    concerning

有关

58        material

材料

60-1    means

手段

60-2    method

方法

62        instrument

工具

64        bapatient

(pinyin: bǎ)-受事 (patient – in the sentence contains )

66-1    direction

方向

66-2    aim

68        beneficiary                 

受益者

70        contrast

参照体

72        partner

相伴体

74        accompaniment

伴随

76        attributive

80        cost

代价

82        degree

程度

84        modifier

(通常是形容

86        restrictive

限定(通常是名,如算机件)

88        manner

方式

92-1    LocationIni

所(如:从北京)

92-2    StateIni

原状(如:从英

100      Head (Pivot)

中心(中心事件、中心体)

110      equiv

同位成分

117      target

118      distance

距离

120      possession

占有物

122-1  patient

受事

122-2  PatientProduct

受事成品

122-4  ContentProduct

内容成品

122-5  descriptive

描写体

122-6  isa

122-7  existent

123      content

内容

132      PartOfTouch

触及部件

134-1  ResultIsa

134-2  ResultEvent

果事件

134-3  ResultWhole

果整体

136-1 PatientValue

受事属性/属性

140-1 LocationFin

终处

140-2  StateFin

144      QuantityCompare

量(如:条路比那条3公里

146-1  spefreq

特定

146-2  times

150      result

160      purpose

目的

162-1 duration

162-2  DurationAfterEvent

后延

162-3  TimeFin

时间

170      succeeding

180      remark

注脚

 


Annexe 5       Exemples des microstructures de LexALP (1 p.)

<entry id="fra.espèces_protégées.1038.e" lang="fra" legalSystem="AC" status="UNKNOWN">

    <term>espèce protégée</term>

    <grammar>n.f.</grammar>

    <phraseological-unit>false</phraseological-unit>

    <domain>1.4</domain>

    <domain>4.4</domain>

    <usage frequency="common" geographical-code="AC" technical="false"/>

    <definition>

        <text>

            Espèce menacée ou vulnérable qui est protégée de l’extinction par des mesures

            préventives.

        </text>

        <source date="2006/08/31" sourceType="Url">     

            http://glossary.eea.europa.eu/EEAGlossary/P/protected_species

        </source>

        <source date="2006/09/15" sourceType="Author">Randier (trad)</source>

    </definition>

    <context>

        <text>

             [L’] [é]tat des inventaires des espèces animales sauvages [comprend l’élaboration

             de] [l]istes des espèces protégées [.]

        </text>

        <source documentId="3491828" >Prot. PNEP, ann. I, art. 1.1.2.</source>

    </context>

    <note>...</note>

    <harmonisation-note>...</harmonisation-note>

</entry>

Figure 101 : Microstructure Xml du terme "espèce protégée"

 

<axie id="axi..1432634.e">

    <termref idref="ita.specie_protette_per_legge.1037.e" lang="ita"/>

    <termref idref="fra.espèces_protégées.1038.e" lang="fra"/>

    <termref idref="deu.rechtlich_geschützte_Arten.1039.e" lang="deu" />

    <termref idref="slv.pravno_zavarovana_vrsta.1040.e" lang="slv"/>

    <termref idref="ita.specie_protetta.1200075.e" lang="ita"/>

    <termref idref="slv.zavarovana_vrsta.1256879.e" lang="slv"/>

   

    <axieref idref="axi..2184588.e"/>

    <axieref idref="axi..2184615.e"/>

   

</axie>

Figure 102 : Microstructure Xml d'une axie


Annexe 6           Implémentation de l'affichage en colonnes dans Pivax-2 (1 p.)

Nous avons présenté l'interface en colonnes dans Pivax-2 au II.4.3.2. Voir la Figure 31.

Pour l'implémentation, on a repris la méthode de H.-T. Nguyen. Il a créé un modèle d'affichage en colonnes (un fichier en Xhtml) dans Pivax-1. Voir la Figure 103.

Pour le résultat affiché sur l'interface, on copie le modèle comme un nœud, puis on remplace les contenus par les identificateurs.

Description : Macintosh HD:Users:yingzhang:Desktop:Capture d’écran 2016-03-22 à 09.18.20.png

Figure 103 : Modèle de l'affichage en colonnes


Annexe 7       Schéma de la base de données lexicales de Libellex (1 p.)


Annexe 8       Algorithmes de calcul dans Pivax-3 en pseudo-code (1,5 p.)

Pour simplifier la présentation, on ne donne que l'algorithme principal de la consultation générale. La consultation avancée est basée sur ces algorithmes, mais utilise des conditions supplémentaires.

Entrée : terme (t) et langue (lg)

Sortie : page affichée de la liste de consultation de toutes les langues

 

/* Initialisation de la liste des traductions de 1er niveau */

Collection_par_axie <entree_lexie>;

/* Initialisation de la liste des traductions de 2e et 3e niveau */

Collection_par_proaxie <entree_lexie, niveau>;

 

Consultation_générale (t, lg){

  Collection (Collection_par_axie, Collection_par_proaxie)

           = Collect_des_liens (t, lg

  Affichage (Collection_par_axie, Collection_par_proaxie) 

}

 

/* Collecter tous les liens possibles dans la BDLex */

 

Collect_des_liens (t, lg) {

  Pour chaque volume de lexies (vol_lex)

    Si la langue de vol_lex = lg

      Pour chaque lexie entrée (lex) dans vol_lex

          

          // Chercher par la table d’indextaion (cdm-headword)

          Si le mot-vedette (hw) = t 

 

          /*

          Collecter tous les liens de lex dans sa table LINKS par la clé

          étrangère. Pour chaque enregistrement reçu, on a le type de lien

          (type), le volume cible (volumetarget), la référence cible

          (targetId), et l’étiquette (label).

          */

 

          Select type, volumetarget, targetId, label from vol_lex_LINKS where

          entryid = objectid_de_lex

          Si le type de lien (type) = axeme

            Liste_traduc_1

                   = Chercher_dans_volumes (targetId, volumetarget);

            Pour chaque élément (ele) de la Liste_traduc_1

              Si ele n’existe pas dans Collection_par_axie

                Collection_par_axie += ele

              fSi

            fPour

          fSi

          Si le type de lien (type) == prolexeme

            Liste_traduc_2

                   = Chercher_dans_volumes_prolexeme (targetId, volumetarget,            

                     lable_src)

            Pour chaque élément (ele2) de la Liste_traduc_2

              Si ele2 n’existe pas dans Collection_par_pro

                Collection_par_proaxie += ele2

              fSi

            fPour

          fSi

        fSi

      fPour

    fSi

  fPour

  Return Collection (Collection_par_axie et Collection_par_proaxie)

}

 

 

/* Trier et afficher */

Affichage (Collection_par_axie, Collection_par_proaxie){

  Pour chaque entre lexie de Collection_par_axie

    Chercher le mot-vedette (headword) dans sa table d’indexations

    Ajouter le headword dans List_traduction_niveau_1

  fPour

  Pour chaque entrée lexie de Collection_par_proaxie

    Si cette lexie est la traduction de deuxième niveau

      Chercher le mot-vedette (headword) dans sa table d’indexations

      Si ce headword n’est pas dans la List_traduction_niveau_1

        Ajouter le headword dans List_traduction_niveau_2

      fSi

    fSi

  fPour

  Si List_traduction_niveau_1 n’est pas vide

    Ajouter les élements de la List_traduction_niveau_1 dans le module du

    premier niveau de traduction dans la page Xhtml.

  fSi

  Si List_traduction_niveau_2 n’est pas vide

    Ajouter les élements de la List_traduction_niveau_2 dans le module du

    deuxième niveau de traduction dans la page Xhtml

  fSi

  Collection_tous = Distinct (Collection_par_axie + Collection_par_proaxie)

  Pour chaque lexie de Collection_tous

    Nœud_Xhtml

          = Mise en forme de nœud Xml de lexie à l’aide de feuilles de style

    Ajouter Nœud_Xhtml dans le module du troisième niveau de traduction dans

    la page Xhtml

  fPour

}

 

/*Chercher récursivement les traductions par axème et axie*/

 

Chercher_dans_volumes (targetId, volumetarget) {

  Chercher les liens vers les axèmes

  puis vers les axies

  puis vers les axèmes cibles

  puis chercher les lexies cibles /* type de lien = final, s’arrêter*/

  return toutes les entrées trouvées

}

 

/*Chercher récursivement les traductions par prolexeme et proaxie et traitement d’étiquette*/

 

Chercher_dans_volumes_pro (targetId, volumetarget, lable_src) {

  Chercher les liens vers les prolexèmes

  puis vers les proaxies

  puis vers les prolexèmes cibles

  puis chercher les lexies cibles /* type de lien = final, s’arrêter*/

  Si l’étiquette de prolexème cible vers lexie cible = lable_src

    Marquer que c’est la traduction de deuxième niveau

  Sinon

    Marquer que c’est la traduction de troisième niveau

  fSi

  return toutes les entrées trouvées avec leurs niveaux

}

 


Annexe 9       Expérience sur les appels de Tradoh par SECTra via ActiveMQ pour les prétraductions  (11 p.)

1.     Contexte

Nous avons brièvement présenté cette expérience au IV.1.3.3. Cette expérience concerne quatre spécifications. Selon l'ordre des appels (SECTraActiveMQTradohActiveMQSECTra), il s'agit de : (1) application émettrice de SECTra, (2) application réceptrice de Tradoh, (3) application émettrice de Tradoh, et (4) application réceptrice de SECTra.

Le texte source chinois a été produit par L. X. Wang. Il s'agit une partie d'un corpus économique.

Dans cette expérience, l'entrée est un fichier txt, chaque ligne contient un segment. L'application émettrice de SECTra lit ce fichier, puis récupère les segments et envoie un par un vers la queue de Tradoh (via ActiveMQ). C'est-à-dire que chaque requête contient un seul segment[3].

Tradoh envoie les traductions une à une dans la queue de Sectra (via ActiveMQ). Puis l'application réceptrice de SECTra regroupe toutes les traductions grâce à un identifiant de groupe de requêtes (JMSXGroupID, voir plus bas).  

2.     Description détaillée et algorithme (3,5 p.)

Pour bien comprendre les algorithmes, on présente d'abord les interfaces de ActiveMQ[4], puis les descriptions détaillées de message. Ces présentations sont purement techniques, mais nous aident à comprendre comment fonctionne ActiveMQ.

Table 15 : Interfaces d'ActiveMQ

Interfaces

Description

ConnectionFactory

Un objet administré par le fournisseur (provider) pour créer une Connection.

Connection

Une connexion active vers un JMS fournisseur.

Destination

Encapsule l'identité d'une destination.

Session

Contexte (mono-processus) pour l'émission et la réception de messages.

MessageProducer

Objet pour l'envoi de messages vers une Destination (créé par la Session).

MessageConsumer

Objet pour la réception de messages d'une destination (créé par la Session).

Message

Encapsulation d'un message, Chaque message contient une structure à trois niveaux : entête, propriété et corps (voir la table ci-dessous).

 

Table 16 : Structure de message

Niveaux

Description

Entête (header)

Attributs communs (voir IV.1.3.1.2), destinés au routage et à l'identification du message.

Propriété (property)

Champs supplémentaires pour les propriétés optionnelles, par exemple, JMSXGroupID (groupe de messages), JMSXRcvTimestamp (date de réception), etc.

Corps (body)

Il existe 5 sous-types : StreamMessage, MapMessage, TextMessage, ObjectMessage, et BytesMessage.

Cela permet d'accpeter non seulement les objets Java, mais aussi d'autres types messages. Par exemple, pour TextMessage, ça pourrait être de type String ou un document XML.

Les applications émettrices sont basées sur 2 étapes de traitement.

1.     Créer la connexion avec le serveur ActiveMQ, préciser les contextes de session (par exemple, c'est un émetteur et correspond à SECTra).

2.     Envoyer le(s) message(s).

Les applications réceptrices sont également basées sur 2 étapes de traitement.

1.     Créer la connexion avec le serveur ActiveMQ, préciser les contextes de session, écouter récursivement. S'il y a un message arrivé, on appelle le traitement spécifique (la méthode principale).

2.     Par exemple, pour l'application réceptrice de Tradoh, on a la méthode call_Tradoh qui est un "interprète" de messages (chaque message est sous une forme prédéfinie, ex. segment_source|langue_source|langue_cible|système_TA|id_segment[5]). Cette méthode call_Tradoh s'occupe également l'envoi de la requête à l'Api de Tradoh. Après reçu le résultat de Tradoh, elle envoie le symbole acknowledge à ActiveMQ. À la fin, elle vérifie s'il y a la valeur pour l'attribut ReplyTo. Si oui, elle appelle l'application émettrice de Tradoh pour envoyer la réponse.

Voici l'algorithme d'application réceptrice de Tradoh.

/*Application réceptrice de Tradoh*/

Receiver_Tradoh {

/* Le code de connexion est un code de « formule » pour connecter ActiveMQ par un récepteur */

/* On doit mettre ce code dans toutes les applications réceptrices */

 

  /* Création connectionFactory */

  ConnectionFactory connectionFactory;

 

  /* Initialisation connection */

  Connection connection = null;

 

  /* Création Session */

  Session session;

 

 

  /* Création destination */

  Destination destination;

 

  /* Création consumer */

  MessageConsumer consumer;

 

  /* Établissement de la connection avec le serveur ActiveMQ */

  connectionFactory = new ActiveMQConnectionFactory(

            /*nom d’administrateur, configurer dans le fichier conf */

            "aximag2",

            /*mot de passe, configurer dans le fichier conf */

            "iMAG04",

            /*protocole et adresse du serveur*/

            "tcp://46.105.41.94:61616");

 

  /* Initialisation des délais temporels */

  TIMEOUT = 180s ;

  TIMESLEEP = 30s ;

  TIMEWAIT = 1s ;

 

  /* Préciser les contextes de session. */

  try {

    connection = connectionFactory.createConnection();

    connection.start();

 

    /* On utilise ACKNOWLEDGE comme mode de session pour s’assurer du   

    bon traitement de la requête */

    session = connection.createSession(Boolean.TRUE,

            Session.AUTO_ACKNOWLEDGE);

 

    /* On utilise Queue (file d’attente de messages) comme mécanisme de

    traitement et on précise la destination (Tradoh). Si Tradoh n’a pas de

    Queue associée sur le serveur, ActiveMQ la crée automatiquement.

    Ensuite ActiveMQ crée la connexion avec la Queue Tradoh, existante ou

    juste créée.*/

    destination = session.createQueue("Tradoh");

 

    /* Initialisation du « consommateur » */

    consumer = session.createConsumer(destination);

 

    /* Écouter en boucle infini */

    while (true) {

      /* Essayer de recevoir un message */

      Message message = consumer.receive();

 

      if (message != null) {

 

        /* On utilise un Timer pour éviter d’attendre un message « mort »*/

        Timer T1 = SystemTime ;

       

        /* Appeler le programme spécifique, et recevoir la confirmation 

        de l’appel*/

        boolean res = call_Tradoh(message.getText()) ;

 

        /* Attendre le résultat avec une limite de temps.

        Il y a 3 situations : une bonne réponse, une mauvaise réponse, pas      

        de réponse */

        while (true) {

          if(res){

            /*Recevoir un bon résultat, on envoie le symbole acknowledge */

            message.acknowledge();

            break ;

          }else if(res==null){

            Timer T2 = SystemTime ;

            /*On attend, si on n’a pas reçu la réponse dans TIMEOUT*/

            /*Si le temps est dépassé, on renonce au message. */

            if (T2-T1<TIMEOUT){

              sleep (TIMEWAIT) ;

            }else{

              break ;

            }

          }else { /*res==false*/

              /* mauvaise réponse, on ne peut pas recevoir la réponse de                            

              Tradoh*/

              break ;

          }

        }

      } else {

        /*S'endormir TIMESLEEP si pas de message*/

        sleep(TIMESLEEP) ;

        break;

      }

    }

  } catch (Exception e1) {

    Débug e1;

  }

}

 

/* Code spécifique pour Tradoh*/

call_Tradoh(Message msg){

  msg_type = msg.getType() ;

  if(msg_type==TextMessage){

 

    /* message est sous forme

    segment_source|langue_source|langue_cible|système_TA|id_segment */

 

    param = message.split("\\|");

    segment = param[0];

    ls = param[1];

    lc = param[TM/2];

    TA = param[3];

    id_segment = param[4];

  

    /* API de Tradoh*/

    url =  "http://46.105.41.94/tradoh/?text="+segment+"&source="+ls+"&target="+lc+"&MT="+TA+"&piv=&verbose=0&outFormat=text&nocache=1";

 

    /* Appeler d’API et récupérer le résultat par la méthode get*/

    Document doc ;

    String segment_traduction;

    try{

      doc = Connect(url).timeout(TIMEOUT).get(); 

      segment_traduction = doc.body().text();

    }catch (Exception e){

      Débug e ;

      Return false ; /*mauvaise réponse*/

    }

 

    /*Vérifier si le message a besoin de renvoyer la réponse */

 

    Destination destination = msg.getReplayTo() ;

    if (destination != null){

 

 

      /*reconstruire le résultat sous la forme

      segment_cible|langue_source|langue_cible|système_TA|id_segment */

 

      message_traduction = segment_traduction|ls|lc|TA|id_segment ;

      Sender_Tradoh.sender(message_traduction, "TextMessage", destination);

    }

  }

 

  /*Traitement pour autres types de message, dans nos premières

  implémentations, on utilise seulement le type TextMessage */

  /*

  if(msg_type==MapMessage){…}

  if(msg_type==BytesMessage){…}

 

  */

}

L'algorithme du côté de l'application émettrice ressemble à l'algorithme ci-dessus, mais est plus simple, nous ne le détaillons pas.

3.     Fichier des requêtes en source (3 p.)

Start Time : 2015/09/18 15:19:52

易和展理事会|zho|fra|Google|1

商品和服务贸易及初商品委会|zho|fra|Google|2

专业和管理框架对贸易和展 的影响家会|zho|fra|Google|3

2005年1月17日至19日,日内瓦|zho|fra|Google|4

专业和管理框架对贸易和展的 影响家会告|zho|fra|Google|5

2005年1月17日至19日 在日内瓦万国宫举行|zho|fra|Google|6

|zho|fra|Google|7

章 次 次|zho|fra|Google|8

一、主席的总结3|zho|fra|Google|9

二、组织26|zho|fra|Google|10

附 件|zho|fra|Google|11

出席情况27|zho|fra|Google|12

第 一 章|zho|fra|Google|13

主席的总结|zho|fra|Google|14

1. 专业和管理框架对贸易和展的影响家会于2005年1月17日至19日在日内瓦行。|zho|fra|Google|15

达国家和展中国家的政府如何能在国家次和多边谈判中进专业务贸发挥积极作用,提出了自己的看法。|zho|fra|Google|16

贸发书处编写的背景明“专业和管理框架对贸易和展的影响”和题为专业走出国界:互认协定与《关贸总协定》”的讨论文件受到了称。|zho|fra|Google|17

些文件涉及的问题,各方表示了不同的意。|zho|fra|Google|18

从下文中可以看出,表示的意和提出的建是丰富多的。|zho|fra|Google|19

一、专业展|zho|fra|Google|20

全球市的走向|zho|fra|Google|21

2. 全球所有专业总额在2002年达到10,000亿美元以上。|zho|fra|Google|22

专业是全世界各经济体中增最迅速的一个部。|zho|fra|Google|23

些服中的就速度超经济其他部。|zho|fra|Google|24

展中国家专业务贸易的相重要性与经济体不同,出了下降,而达国家的公司在所有的全球专业都占有主地位。|zho|fra|Google|25

在公司和国家次,正在出现许专业集中化的趋势。|zho|fra|Google|26

专业提供者面前的是生的全球化,区域易和南南易份量的不断增加以及争相关问题重要性的不断增加。|zho|fra|Google|27

然服务业对发展中国家国内生产总值献不断加大,但在量中的份仍然落在易的后面,与达国家相比尤其如此。|zho|fra|Google|28

专业的作用|zho|fra|Google|29

3. 专业强经济竞争力的一种基础设施服务发挥着重要的作用。|zho|fra|Google|30

这类是所有商的投入,其量和争力决定着外溢效模。|zho|fra|Google|31

专业具有的一种关键发展影响在于往往称之“知识经济”的献。|zho|fra|Google|32

经济学者发现,人力本、增加经济率之存在着密切关,而专业往往新的前沿。|zho|fra|Google|33

这类,尤其是在展中国家和最不达国家,实现《千年宣言》的社会经济发展目具有直接影响。|zho|fra|Google|34

另外,服务贸问题与《千年宣言》的减、目8的实现以及建立全球展伙伴关系的努力都直接相关。|zho|fra|Google|35

4. 专业包括经认证专业,如律、医生、会计师、建筑和工程,也包括未经认证的或自由操业专业。|zho|fra|Google|36

专业的范和定各国有所不同。|zho|fra|Google|37

多数展中国家接受的是专业的一种广,其中包括与土著易相的新服或与其他服务贸系在一起的服,如海事服,尤其是算机和相关服。|zho|fra|Google|38

例如,在旺达,除了传统专业以外,行人和保险业也被认为专业。|zho|fra|Google|39

专业务贸易与展中国家|zho|fra|Google|40

5. 展中国家的经验清楚地示了专业务贸易可来的展收益。|zho|fra|Google|41

专业出口在2002年达到2,700亿美元,展中国家占出口的15%。|zho|fra|Google|42

由于缺乏充分的分数据,在无法正确展中国家专业出口的走易方向。|zho|fra|Google|43

看来,商机会主要大型跨国专业公司所用,这类公司存在于若干市,与当地公司相,是全球网的一部分。|zho|fra|Google|44

有相互承认协专业提供者提供服就可得到便利。|zho|fra|Google|45

于其他专业提供者来,在国外提供服的机会相当有限。|zho|fra|Google|46

所有服提供者,包括中小型企,都有利基市,因为专业务带来的是大量商机(例如,合王国的专业占国内生产总值的15%),而且并不仅仅限于大型公司。|zho|fra|Google|47

于多数展中国家而言,专业出口的模仍然不大,但在有些情况下实现业绩突出的增率。|zho|fra|Google|48

例如,哥就属于种情况,国的商出口在近些年来实现了13%的年增率,安第斯各国吸收了其出口的31%。|zho|fra|Google|49

另外,像巴西和印度这类发展中国家正在成为专业的全球角色。|zho|fra|Google|50

印度的外包公司就是成功融入世界市的一个例子。|zho|fra|Google|51

全球服外包期到2006年将达到1万亿美元,其中只有2%是国际间的交易。|zho|fra|Google|52

美国市占印度外包的60%,但在美国服务总进口中只不是1%。|zho|fra|Google|53

印度的服外包从1999-2000年期的5亿6,500万美元增加到了2003-2004年期的36亿美元。|zho|fra|Google|54

合王国已印度外包服的第二大市,并且成480家印度公司的业务基地,些公司合王国,以便入欧盟市。|zho|fra|Google|55

由此而来的两国之近来已达到了平衡状。|zho|fra|Google|56

就巴西而言,服务总出口的36%是商专业,其中大部分是工程和建筑服。|zho|fra|Google|57

6. 经济规模小的展中国家,如加勒比共同体各国和毛里求斯,往往依门对国内生产总值和就作出主要献。|zho|fra|Google|58

岛屿发展中国家于保持一种开放型易制度,金融服和旅游服占有最大的易份,是经济展的主要推力量,而专业些部的重要投入。|zho|fra|Google|59

岛屿发展中国家的一步易和展必明确无地依于在国内生产总值中已占三分之二以上的服务业。|zho|fra|Google|60

一些最不达国家,如旺达,成功地保持了高经济率,其原因在很大程度上并不仅仅信、旅游和运的壮大,而且有包括咨在内的专业的增。|zho|fra|Google|61

动态:外包|zho|fra|Google|62

7. 展中国家外包产业其社会经济发来了直接或接的收益。|zho|fra|Google|63

例如,在印度,预计到2008年在产业中就的人将达到200万,按照系数3的乘数效,在次造出更多的工作位。|zho|fra|Google|64

外包方式通在其他国家建立起专营店,推了提供算机教育培的民教育域的易。|zho|fra|Google|65

些服经发展到了提供基本的理和更高的程度,因大学作太慢,无法适新技的需求和针对迅速化的市作出反。|zho|fra|Google|66

外包产业提供了薪金高的工作位,来了收入的增,推了消。|zho|fra|Google|67

一部的年工15%。|zho|fra|Google|68

中的高减率表明,外包服务产业创造的技能是“便携式”的。|zho|fra|Google|69

因此,些技能就能向国内产业转移。|zho|fra|Google|70

信法改革及自由化降低了信服用,得到了全球外包产业需要的推。|zho|fra|Google|71

了加在出口市中的地位,外包服务业的公司力求得到在自己出口市的公司开出的高明,以求保持品的量水准和足西方国家客的需要。|zho|fra|Google|72

由于一服务产业中的人有40%至60%是女性,外包服提供去几乎没有的更高增机会于提高女性地位有着突出的影响。|zho|fra|Google|73

一部门还诞生出了印度的多国公司,既TCS、Infosys和Wipro, 些公司在范广泛的服中正在取得国际竞争力,并在全球扩张业务。|zho|fra|Google|74

最后,信息和通信技的成功于打造印度品牌作出了献,在如旅游、娱乐专业和其他服的部生了极的外溢效。|zho|fra|Google|75

易和展基准|zho|fra|Google|76

8. 在专业务领域,有可能制订贸易和展基准(下文),在些服务对发展所作献的基展中国家是否正在切有效地融入国际贸易体系和判并从中得益。|zho|fra|Google|77

展中国家专业的供能力和争力。|zho|fra|Google|78

方面的主要决定因素是高等和技教育的量和推广。|zho|fra|Google|79

与其他一些服不同,方面的比较优势在于成本、量、争性劳动力的合和在相关造、用和专门。|zho|fra|Google|80

在新的知识经济方面,除其他外,由商、信息技、研究与展、以及设计和工程服构成的这类争力的主要因素。|zho|fra|Google|81

由于展中国家的中小企业规模不大,得充足的本和信,无法承担大的商业风险,特是不能像达国家的中小型企,在展中国家的国家一没有特方案和公共支助措施,因此于特不利的地位。|zho|fra|Google|82

加大展中国家在专业务贸易中的份和加强发展中国家于国际贸易中新和有活力部的参与。|zho|fra|Google|83

当指出,展中国家不断加大了专业务进口的参与,而且也加方面出口的参与,但些国家仍然是专业净进口国。|zho|fra|Google|84

有出口的仅仅是少数展中国家,并局限于传统专业,主要是通模式4和1实现的。|zho|fra|Google|85

但是,展中国家的公司正在开争力的利基市,如专业化的保健服、包括生物技在内的研算机服和工程服。|zho|fra|Google|86

对发展中国家出口的市开往程度及展中国家市场对其他国家开放。|zho|fra|Google|87

澳大利力委会近期的一研究于跨专业和跨国家的限制性程度作了比,其中表明,认证专业易在全世界都仍然面重的限制。|zho|fra|Google|88

专业提供者在开方面往往比已在运行的业务更多的限制。|zho|fra|Google|89

据指出,在认证专业中,法律服最受限制,接下来是会、建筑和工程服。|zho|fra|Google|90

但受影响最重的是展中国家专业的流动问题,因目前存在着市准入和入境障碍,包括在注册、可、核、承认证方面的国内法以及关于居住、国籍或公民权规定的影响。|zho|fra|Google|91

达国家已看到了定价和广告限制这类争做法争力和服出口生的面影响。|zho|fra|Google|92

另外,达国家市场势大的有组织利害关系方行的反争做法也来了障碍,影响了展中国家的供者,除其他外,有可能抵消易自由化特中小型企和消来的极影响。|zho|fra|Google|93

展中国家的自由化而言,然扶持国内供能力和争力以及大基本服准入的政策空是尤其必要的,但技能转让、投和并入全球网是尽量展的献的必要条件。|zho|fra|Google|94

、男女平等和福利、公共利益、造就、技能开和增、信通技术传播和技术创新。|zho|fra|Google|95

专业与自己的精英形象正相反,它能帮助人民困,而高效率和得到推广的专业也就能因此而公共利益作出献,通提供更好的保健和教育及社会服等等减轻贫困的面影响。|zho|fra|Google|96

专业展在展中国家是新的和更多的高薪及正的来源。|zho|fra|Google|97

它是由技能展所推的,并且有助于提高物、服易生的增加。|zho|fra|Google|98

多数展中国家的专业有高度的性敏感力和极影响。|zho|fra|Google|99

例如,女在国内外都极地从事士、教和社会工作者的服。|zho|fra|Google|100

longueur moyenne 39.66

End Time : 2015/09/18 15:19:52

4.     Prétraductions reçues  (4 p.)

Conseil du commerce et du développement|zho|fra|Google|1

Commerce des marchandises et des services et produits de base|zho|fra|Google|2

Impact sur les réunions de commerce et d'experts du développement de services professionnels et de cadres réglementaires|zho|fra|Google|3

Le 17 janvier 2005 à 19, Genève|zho|fra|Google|4

Rapport des services professionnels et des cadres réglementaires pour l'impact du commerce et du développement de réunions d'experts|zho|fra|Google|5

Tenue au Palais des Nations 2005 17 à 19 Janvier|zho|fra|Google|6

SOMMAIRE|zho|fra|Google|7

Chapitre Page|zho|fra|Google|8

Tout d'abord, le résumé du Président 3|zho|fra|Google|9

Questions d'organisation 26|zho|fra|Google|10

ANNEXE|zho|fra|Google|11

Participation 27|zho|fra|Google|12

Premier chapitre|zho|fra|Google|13

Résumé du président|zho|fra|Google|14

L'impact sur le commerce et expert en développement réunion 1. Les services professionnels et des cadres réglementaires en 2005 17 Janvier au 19 à Genève.|zho|fra|Google|15

Pour le Gouvernement des pays développés et en développement sur la façon de promouvoir le commerce dans les services professionnels peuvent jouer un rôle actif au niveau national et des négociations multilatérales, les experts ont présenté leurs vues.|zho|fra|Google|16

Note d'information établie par le secrétariat de la CNUCED "services professionnels et l'impact des cadres de réglementation sur le commerce et le développement», et intitulé «professionnels là-frontières: accords de reconnaissance mutuelle avec le" "" document de travail du GATT a été salué.|zho|fra|Google|17

Pour toute question concernant ces documents, les parties ont exprimé des opinions différentes.|zho|fra|Google|18

Comme on peut le voir dans ce qui suit, les recommandations et les observations faites dans une variété de spectacles.|zho|fra|Google|19

Un service professionnel et le développement|zho|fra|Google|20

Les tendances du marché mondial|zho|fra|Google|21

2. La quantité totale de tous les marchés de services professionnels à travers le monde a atteint plus de 1 billion $ en 2002.|zho|fra|Google|22

Services professionnels est les économies du monde dans l'un des secteurs à plus forte croissance.|zho|fra|Google|23

Ce emploi dans les services a progressé plus vite que le reste de l'économie.|zho|fra|Google|24

L'importance relative du commerce des services professionnels dans les pays en développement et les pays développés, il a été diminué, tandis que les entreprises dans les pays développés sur tous les marchés mondiaux de services professionnels sont dominants.|zho|fra|Google|25

Dans les entreprises nationales et les niveaux, de nombreux services professionnels centralisés tendances émergentes.|zho|fra|Google|26

Dans le même temps, placé en face d'un fournisseur de services professionnels est la mondialisation de la production, l'augmentation du commerce régional et l'augmentation des échanges Sud-Sud et les questions liées à la concurrence importance lourde.|zho|fra|Google|27

Bien que la contribution du secteur des services au PIB dans les pays en développement continuent d'augmenter, mais sa part dans le commerce total reste à la traîne commerce des marchandises, par rapport aux pays développés en particulier.|zho|fra|Google|28

Le rôle des services professionnels|zho|fra|Google|29

3. Les services professionnels afin d'améliorer la compétitivité économique comme un service d'infrastructure joue un rôle important.|zho|fra|Google|30

Ce service est mis toutes les activités commerciales, la qualité et la compétitivité de déterminer la taille des effets d'entraînement.|zho|fra|Google|31

Un impact sur le développement crucial des services professionnels réside dans la contribution des personnes ont souvent appelé «l'économie de la connaissance».|zho|fra|Google|32

Les chercheurs en économie ont trouvé que le capital humain, il existe une corrélation étroite entre la croissance économique et l'augmentation de la valeur, et les services professionnels sont souvent à la pointe de l'innovation.|zho|fra|Google|33

Ces services, en particulier dans les pays en développement et les moins avancés, pour obtenir la "Déclaration du Millénaire" des objectifs socio-économiques de développement a un impact direct.|zho|fra|Google|34

En outre, la réduction du commerce des services et de la pauvreté, de l'engagement "Déclaration du Millénaire", la mise en œuvre, et d'établir un partenariat mondial pour les efforts de développement sont directement liés à l'objectif 8.|zho|fra|Google|35

4. Les services professionnels comprennent des professionnels certifiés tels que les avocats, les médecins, les comptables, les architectes et les ingénieurs, ainsi que des non autorisées ou libres professionnels de l'industrie de l'exercice.|zho|fra|Google|36

La portée et la définition des services professionnels varient Unis.|zho|fra|Google|37

La plupart des pays en développement à accepter une définition large de services professionnels, y compris les nouveaux services et produits associés commerciales ou le commerce des liens indigènes avec d'autres services avec des services tels que les services maritimes, notamment informatiques et services connexes.|zho|fra|Google|38

Par exemple, au Rwanda, en plus de professionnels traditionnels, les banquiers et le personnel d'assurance sont considérés comme des professionnels.|zho|fra|Google|39

Professionnel commerce des services avec les pays en développement|zho|fra|Google|40

5. L'expérience des pays en développement montre clairement les avantages des services de développement des affaires professionnelles à sa portée.|zho|fra|Google|41

Les exportations de services professionnels ont atteint 270 milliards de $ en 2002, 15% des exportations totales des pays en développement.|zho|fra|Google|42

En raison de l'absence de données ventilées adéquates, nous ne pouvons pas évaluer correctement le sens de la tendance et le commerce des exportations de services professionnels des pays en développement.|zho|fra|Google|43

Opinion, les occasions d'affaires sont principalement utilisés par les grandes entreprises transnationales professionnels, ces entreprises existent dans un certain nombre de marchés, associée avec des entreprises locales, il fait partie d'un réseau mondial.|zho|fra|Google|44

Accords de reconnaissance mutuelle dans l'ordre, les fournisseurs de services professionnels pour fournir des services peuvent être facilitées.|zho|fra|Google|45

Pour les autres fournisseurs de services professionnels, la possibilité de fournir des services dans un pays étranger est assez limité.|zho|fra|Google|46

Tous les fournisseurs de services, y compris les PME, ont un marché de niche, car un grand nombre de services professionnels pour apporter des affaires (par exemple, les services professionnels Royaume-Uni représentaient 15% du PIB), mais ne se limite pas aux grandes entreprises.|zho|fra|Google|47

Pour la plupart des pays en développement, l'ampleur des exportations de services professionnels est encore petit, mais dans certains cas d'atteindre un taux de rendement exceptionnel de croissance.|zho|fra|Google|48

Par exemple, comme cela est le cas de la Colombie, les services commerciaux, les exportations du pays au cours des dernières années pour atteindre un taux de croissance annuel de 13%, les pays andins d'absorber 31% de ses exportations totales.|zho|fra|Google|49

En outre, les pays en développement comme le Brésil et l'Inde sont de plus le rôle mondial de services professionnels.|zho|fra|Google|50

Entreprises indiennes d'externalisation est un exemple d'intégration réussie dans le marché mondial.|zho|fra|Google|51

Externalisation mondiale devrait à 2006 atteindra $ 1000000000000, dont seulement 2% a été négociée à l'échelle internationale.|zho|fra|Google|52

Le marché américain a représenté 60 pour cent de la sous-traitance de l'Inde, mais le service aux États-Unis dans les importations totales est seulement un pour cent.|zho|fra|Google|53

Inde valeur de la sous-traitance de 1999 - 500 millions de $ 65 millions au cours de la période de 2000 à 2003 - $ 3,6 milliards en 2004.|zho|fra|Google|54

Le Royaume-Uni est devenu le deuxième plus grand marché pour les services d'externalisation indiennes, 480 en Inde et est devenu la base de l'entreprise de la société, ces sociétés basées au Royaume-Uni, afin d'entrer dans le marché de l'UE.|zho|fra|Google|55

L'investissement bilatéral coule entre les deux pays résultant de l'équilibre a récemment atteint.|zho|fra|Google|56

Pour le Brésil, desservant 36 pour cent du total des exportations de services commerciaux et professionnels, dont la plupart sont d'ingénierie et de construction.|zho|fra|Google|57

6. La petite taille de l'économie des pays en développement, tels que les pays de la Communauté des Caraïbes et l'île Maurice, ont tendance à compter sur le secteur des services domestiques PIB et l'emploi à faire des contributions majeures.|zho|fra|Google|58

PEID ont tendance à maintenir un système commercial ouvert, les services financiers et les services touristiques représentent la plus grande part du commerce, est la principale force motrice pour le développement économique et, et les services professionnels sont des éléments importants dans ces secteurs.|zho|fra|Google|59

Davantage le commerce et le développement des petits États insulaires en développement doivent sans ambiguïté dépend du produit intérieur brut a plus que deux tiers des services.|zho|fra|Google|60

Certains des pays les plus développés, tels que le Rwanda, a réussi à maintenir un taux élevé de croissance économique, qui est en grande partie la raison est non seulement télécommunications, le tourisme et l'expansion des services de transport, y compris, mais également des services consultatifs, y compris les services professionnels croissance.|zho|fra|Google|61

Nouveaux développements: Externalisation|zho|fra|Google|62

7. Le développement de l'industrie de l'externalisation dans les pays en développement pour le développement social et économique a apporté des avantages directs ou indirects.|zho|fra|Google|63

Par exemple, en Inde, est attendu pour 2008, l'emploi dans cette industrie atteindra les 2 millions, selon le coefficient de l'effet multiplicateur de 3 dans l'emploi secondaire va créer plus d'emplois.|zho|fra|Google|64

L'externalisation par les magasins de franchise établis dans d'autres pays, afin de promouvoir le commerce fournir une éducation de formation en informatique et dans le domaine de l'enseignement privé.|zho|fra|Google|65

Ces services ont été développés dans la mesure de fournir l'informatique de base et une formation plus poussée, parce que l'université trop lent, incapable d'adapter aux besoins de la nouvelle technologie et de réagir contre un marché en évolution rapide.|zho|fra|Google|66

Outsourcing fournit un emploi salariaux élevés, ce qui porte la croissance des revenus, et de promotion de la consommation.|zho|fra|Google|67

La croissance annuelle des salaires dans ce secteur est de 15%.|zho|fra|Google|68

Les employés des taux d'attrition élevés suggèrent que l'externalisation industries pour créer compétences sont "portable" en.|zho|fra|Google|69

Par conséquent, ces compétences seront en mesure de transférer à l'industrie nationale.|zho|fra|Google|70

Télécommunications réforme de la réglementation et la libéralisation du secteur des télécommunications dans la réduction du coût des services de télécommunications, qui a été la promotion des besoins de l'industrie mondiale de l'externalisation.|zho|fra|Google|71

Afin de renforcer sa position dans le marché de l'exportation, des services d'impartition société a cherché à se mettre en place dans leurs marchés d'exportation de sociétés de haute qualité à prouver, en vue de maintenir les normes de qualité des produits et de répondre aux besoins des clients dans les pays occidentaux.|zho|fra|Google|72

En raison de ce service personnel de l'industrie ont 40-60 pour cent sont des femmes, en offrant des services à plus forte valeur ajoutée sous-traitance dans le passé presque pas de possibilités d'emploi pour améliorer le statut des femmes a une influence importante.|zho|fra|Google|73

Le ministère a également né de sociétés multi-nationales de l'Inde, à la fois TCS, Infosys et Wipro, ces entreprises une large gamme de services qui sont faits l'expansion compétitive au niveau international et mondial de ses activités commerciales.|zho|fra|Google|74

Enfin, l'information et le secteur de la technologie de communication pour la marque de construction réussie en Inde a contribué dans des secteurs tels que le tourisme, les loisirs, les services professionnels et autres services ont eu un effet d'entraînement positif.|zho|fra|Google|75

Repères de Commerce et développement|zho|fra|Google|76

8. Dans le domaine des services professionnels, la possibilité de développer des référentiels de commerce et de développement (voir ci-dessous), afin d'évaluer si les pays en développement sont effectivement intégrés dans les négociations relatives au système commercial et commerciales internationales sur la base de la contribution attendue au développement de ces services sur et en tirer des avantages .|zho|fra|Google|77

La capacité d'offre et la compétitivité des services professionnels dans les pays en développement.|zho|fra|Google|78

Le principal facteur déterminant à cet égard est la qualité de l'éducation et de promotion supérieur et technique.|zho|fra|Google|79

Contrairement à d'autres secteurs de services diffèrent, l'avantage comparatif à cet égard est que la combinaison de coût, de qualité, travail concurrentiel et les domaines connexes à la création, l'application et la diffusion de l'expertise.|zho|fra|Google|80

Dans la nouvelle économie du savoir, en plus d'autres choses, les services de conseil en affaires et technologie de l'information, recherche et développement, ainsi que des services de conception et d'ingénierie de tels services constituent un facteur important de la compétitivité.|zho|fra|Google|81

En raison de la petite taille des PME dans les pays en développement, il est difficile d'obtenir des capitaux et de crédit suffisant, ne peuvent se permettre les risques commerciaux plus importants, en particulier les petites et moyennes entreprises dans les pays développés ne peuvent pas être comme ça, pas de programmes spéciaux au niveau national dans les pays en développement et des mesures de soutien publiques, donc à un désavantage particulier.|zho|fra|Google|82

Augmenter la part des pays en développement dans les échanges de services professionnels et de renforcer la participation des pays en développement dans le commerce international dans des secteurs nouveaux et dynamiques.|zho|fra|Google|83

Il convient de noter que tandis que les pays en développement continuent d'accroître la participation des importations de services professionnels, mais aussi de renforcer la participation des exportations à cet égard, mais ces pays sont encore des importateurs nets de services professionnels.|zho|fra|Google|84

Il ya seulement quelques pays en développement, les exportations et les activités professionnelles traditionnelles limitées, principalement par le mode 4 et 1 mise en œuvre.|zho|fra|Google|85

Toutefois, les entreprises des pays en développement est de développer des marchés de niche concurrentiels, tels que les services de santé spécialisés, y compris la recherche en biotechnologie et des services de développement, de services informatiques et de services d'ingénierie.|zho|fra|Google|86

Pour les exportations des pays à destination du degré d'ouverture des marchés et le développement de marchés à d'autres pays.|zho|fra|Google|87

Une étude australienne a comparé la récente Commission de la productivité pour limiter l'ampleur de la multi-disciplinaire et de cross-country, ce qui montre que le commerce professionnel certifié dans le monde est toujours confronté à de sérieuses contraintes.|zho|fra|Google|88

Les prestataires de services sont souvent confrontés à en termes d'ouverture plus limitée que ce qui a été l'organisation d'activités d'affaires.|zho|fra|Google|89

Il a été noté que, dans le Certified Professional, les services juridiques les plus limitées, suivis par les services de comptabilité, d'architecture et d'ingénierie.|zho|fra|Google|90

Cependant, le plus touché est le flux de professionnels dans les pays en développement, car actuellement il ya l'accès aux marchés et de barrières à l'entrée, l'enregistrement, les licences, la certification, ainsi que la législation nationale sur la résidence, la nationalité ou la reconnaissance de la citoyenneté et de la certification, y compris dispositions de.|zho|fra|Google|91

Les pays développés ont déjà vu les prix et de publicité restrictions telles pratiques anti-concurrentielles sur la compétitivité et les exportations de services ont généré un impact négatif.|zho|fra|Google|92

En outre, les puissants marchés organisés des pays développés à mettre en œuvre les pratiques anti-concurrentielles des parties prenantes ont également apporté trouble qui affecte les fournisseurs dans les pays en développement, notamment, il est possible de compenser la libéralisation des échanges en particulier pour les petites et moyennes entreprises et Consumer impact positif.|zho|fra|Google|93

Sur la libéralisation des pays en développement, bien que le soutien aux capacités nationales d'approvisionnement et la compétitivité, et élargir l'accès aux services de base est un espace politique particulièrement nécessaire, mais le transfert des compétences, la promotion des investissements et de l'intégration dans le réseau mondial de maximiser les échanges sur la croissance et contribution au développement des conditions nécessaires.|zho|fra|Google|94

Réduction de la pauvreté, l'égalité des sexes et le bien-être, l'intérêt public, la création d'emplois, développement des compétences et la diffusion des TIC à valeur ajoutée et l'innovation technologique.|zho|fra|Google|95

Un service professionnel avec leur image élite contraire, elle peut aider les gens à sortir de la pauvreté, et la haute efficacité et des services professionnels sera promu peut donc contribuer à l'intérêt public en fournissant de meilleurs soins de santé et l'éducation et les services sociaux, etc. atténuer les effets négatifs de la pauvreté.|zho|fra|Google|96

Développement de services professionnels dans les pays en développement sont sources d'emplois bien rémunérés et informel nouvelles et supplémentaires.|zho|fra|Google|97

Elle est entraînée par le développement des compétences, et aider à augmenter la valeur ajoutée des biens, des services et de la production commerciale.|zho|fra|Google|98

Services professionnels dans la plupart des pays en développement sont très sensibles au genre vigueur et l'impact positif.|zho|fra|Google|99

Par exemple, les femmes sont activement engagés dans des infirmières nationaux et étrangers, les enseignants et les travailleurs des services sociaux.|fra|Google|100

End Time : 2015/09/18 15:20:33

 


Annexe 10   Spécifications de Lextoh (4 p.)

1.          Configurations et descripteurs des outils utilisables

Notre fichier "RESSOURCES" permet de décrire les outils par langue ou par outil. Nous avons déjà montré un exemple de "ressource par outil" au IV.2.3.2.4. Voici un exemple de "ressource par langue".

<!-- Ressources connues de LEXTOH, par langue -->

<RESSOURCES dateCreation = "20140221" dateDerniereModif = "20150508"

            typeRessources = "parLangue">

<!-- Lemmatiseurs ou autres du français -->

  <LANGUE codeLG = "FRA">

    <LM codeLM = "XIP" codeEnt = "utf8" codeLGxip = "fr"

      transcription = "telQuel" sortiesPossibles = "liste"

      url = "https://open.xerox.com/Services/XIPParser/Pages/Using%20XIP"

      requeteType = "API" requete = "http://atoum.imag.fr/getalp/Services/

          Web/CREATDICO/callXip.php?lang=fra&text=$fichEnt "/>

 

    <LM codeLM = "Ariane_FR4" codeEnt = "utf8" codeLGariane = "FR1"

      transcription = "transIntermFr" sortiesPossibles = "arbre_A xml"

      url = "http://www.taranis-software.com" requeteType = "CURL"

      requete = "curl \"http://www.taranis-software.com/Heloise/Ying/test.

          php\" --data \"InputText=$fichEnt&CoupleLangue=FR4-$fichSort\""/>

 

    <LM codeLM = "XELDA" codeEnt = "utf8" codeLGxelda = "fr"

      transcription = "telQuel" sortiesPossibles = "liste xml"

      url = "www.xrce.xerox.com/About-XRCE/History/Historical-

          projects/XeLDA/" requeteType = "EXEC"

      requete = "xelda MorphoAnalysis plaintext $fichSort $fichEnt

          fra FST FSTPOSTag " />

    ...

  </LANGUE>

 

<!-- Lemmatiseurs ou autres de l'anglais -->

  <LANGUE codeLG = "ENG">

    <LM codeLM = "XELDA" codeEnt = "utf8" codeLGxelda = "en"

      transcription = "telQuel" sortiesPossibles = "liste xml"

      url = "www.xrce.xerox.com/About-XRCE/History/Historical-

          projects/XeLDA/" requeteType="EXEC"

      requete = "xelda MorphoAnalysis plaintext $fichSort $fichEnt

          eng FST FSTPOSTag " />

...

  </LANGUE>

</RESSOURCES>

D'autre part, un descripteur permet de configurer les paramètres fixés, par exemple, la langue de dialogue pour l'interaction (pour l'instant, ne se fait que pour le français), les statistiques statiques pour voir les paramètres préférés pour chaque outil appelable.

<!-- Langue de dialogue -->

<LANGUE dateCreation = "20140221" dateDerniereModif = "20140515"

CodeLang = "fr" Mode="ACTIVE"/>

<!-- LANGUE dateCreation = "20140221" dateDerniereModif = "20140221" CodeLang = "en" Mode=""--/>

<!-- LANGUE dateCreation = "20140221" dateDerniereModif = "20140221" CodeLang = "zh" Mode=""--/>

<!-- Statistiques statiques -->

<Outil codeLM = "XELDA" nbrCall = "1138" >

  <LANGUE codeLang = "fr" typeSortie = "liste" nbrCall = "541"/>

  <LANGUE codeLang = "fr" typeSortie = "xml" nbrCall = "80"/>

  <LANGUE codeLang = "en" typeSortie = "liste" nbrCall = "462"/>

  <LANGUE codeLang = "en" typeSortie = "xml" nbrCall = "55"/>

<Outil/>

<Outil codeLM = "Ariane_FR4" nbrCall = "847" >

...

<Outil/>

2.          Spécificiation des entrées (0,25 p.)

On a présenté les entrées de façon "naturelle" au IV.2.2.1. Voici la spécification des paramètres et des métadonnées concernant l'entrée. La syntaxe utilisée est celle d'Ariane-G5 pour la déclaration des variables.

-CHA- text == (inDefaut = 'textIn'). ** chaîne qui peut avoir la syntaxe d'un chemin.

-EXC- lang == (fra, zho, eng, deu, esp, por, pol,…). ** EXC : exclusive

-NEX- lemmat == (jieba, xelda, ariane-heloise, xip,…). ** NEX : non exclusive, 1 ou plusieurs valeurs possibles dans la liste, ensemble vide = lemmat0.

-EXC- output == (txt, json, xml).

-EXC- formalism == (reduit, graphe-Q).

-EXC- debug == (debug1). **debug0 est la valeur par défaut.

-NUM- window == (inDefaut = 'NumberIn'). ** NUM : number, fonctionne uniquement pour le Delaf.

-EXC- form == (1,0).

3.          Spécificiation des sorties (2 p.)

Comme on l'a présenté plus haut, Lextoh permet de suivre le flot de traitement de la sortie native à la sortie finale par le mode avancé. Dans le mode normal, on affiche uniquement la sortie finale.

a.              Sortie native

C'est le résultat original du lemmatiseur appelé, sans aucune modification. Pour le Delaf,  la sortie native est une requête MySQL. On la transmet dans un tableau pour l'afficher sur l'interface.

Voici deux sorties natives (xip et Delaf) pour bonjour, tu vas bien ?.

Description : Macintosh HD:Users:yingzhang:Documents:suivi de thèse:plan de these:pic:Annexe:Lextoh_annexe_pic_1.png

Figure 104 : Sortie native de Xip

Description : Macintosh HD:Users:yingzhang:Documents:suivi de thèse:plan de these:pic:Annexe:Lextoh_annexe_pic_2.png

Figure 105 : Sortie native du Delaf

 

b.              Sortie brute

La sortie brute est un tableau (Array). Dans cette étape, le système uniformise les clés (ex. lang, form, pos, allTag, start et end) pour l'étape suivante (sortie en forme lemmatix). Pour cette uniformisation, nous pouvons utiliser Tracompl pour décrire les règles de transformation. Pour l'instant, nous avons fait de façon ad hoc. Le système garde encore toutes les informations de la sortie native. Voir l'exemple ci-dessous.

Description : Macintosh HD:Users:yingzhang:Desktop:Capture d’écran 2015-04-28 à 16.35.20.png

Figure 106 : Exemple d'une sortie brute

c.              Langage Lemmatix

Avant de parler du format suivant (le format informatisé), on présente d'abord la forme (ou le langage) Lemmatix, utilisée dans Lextoh, pour normaliser les sorties des différentes formes possibles. La normalisation porte sur les noms et les valeurs des attributs. La syntaxe de Lemmatix est décrite en Xml. On présente sa DTD dans la figure suivante.

 

<!DOCTYPE LEMMATIX [

<!ELEMENT LEMMATIX (lexeme*)>

<!ELEMENT lexeme (entry*)>

<!ELEMENT entry (lemma,pos,morpho-tag-list)>

<!ELEMENT lemma (#PCDATA)>

<!ELEMENT pos (#PCDATA)>

<!ELEMENT morpho-tag-list (morpho-tag?)>

<!ELEMENT morpho-tag (#PCDATA)>

 

<!ATTLIST LEMMATIX syst CDATA #REQUIRED>

<!ATTLIST LEMMATIX lang CDATA #REQUIRED>

<!ATTLIST lexeme startpos CDATA #REQUIRED>

<!ATTLIST lexeme endpos CDATA #REQUIRED>

<!ATTLIST lexeme form CDATA #REQUIRED>

<!ATTLIST lemmat confidence CDATA #IMPLIED>

<!ATTLIST lemmat type CDATA #IMPLIED>

<!ATTLIST pos confidence CDATA #REQUIRED>

]>

Figure 107 : Lemmatix.DTD

Pour des raisons d'implémentation informatique, on a conçu deux sous-formes. La sous-forme lemmatix intermédiaire et la sous-forme lemmatix finale sont toutes les deux conformes à lemmatix.dtd.

d.              Sortie en lemmatix intermédiaire

Les valeurs de la forme intermédiaire sont des valeurs directes qui sont extraites des différents lemmatiseurs. Par exemple :

GNR(MASC,FEM) <morpho-tag>MASC,FEM<morpho-tag>.

 

Description : Macintosh HD:Users:yingzhang:Documents:suivi de thèse:plan de these:pic:Annexe:Lextoh_annexe_pic_4.png

Description : Macintosh HD:Users:yingzhang:Documents:suivi de thèse:plan de these:pic:Annexe:Lextoh_annexe_pic_5.png

Figure 108 : Deux exemples de lemmatix intermédiaire

e.              Sortie en Lemmatix finale

Les valeurs de la forme finale sont des valeurs traitées et uniformisées des différents lemmatiseurs. Par exemple :

<pos>+nom</pos> <pos>noun<pos>.

Pour unifier les résultats de différents analyseurs morphologiques, nous avons utilisé le standard ISOcat DCR [ISOcat, 2008].

f.               Sortie finale (résultat de filtrage)

Le système produit différentes sorties finales. Chaque sortie finale est une combinaison de format+formalisme. Voir le paragraphe Entrées et Sorties au IV.2.2.1.


Annexe 11        Spécifications de CreatDico

La conception de CreatDico ressemble beaucoup à celle de Lextoh.

1.          Configurations et descripteurs des outils utilisables (0,5 p.)

Comme pour Lextoh, on a un fichier "RESSOURCE" pour décrire les outils utilisables par langue ou par outil. Par exemple :

<!-- Ressources connues de CREATDICO, par langue -->

<RESSOURCES dateCreation = "20140222" dateDerniereModif = "20151208" Auteur             

            = "Ying" Accessible = "Public">

<!-- Services de dictionnaires -->

  <SERVEURS>

    <SERV codeServ = "Papillon" codeEnt = "utf8" callType="API" url =

      "http://www.papillon-dictionary.org/papillon/api/$dico/$lang/cdm- 

      headword/$headword/cdm-translation?strategy=EQUAL" />


    <SERV codeServ = "Pivax" codeEnt = "utf8" callType="API" url =

     "http://getalp.imag.fr/pivax/api/$dico/$lang/link/manger

      ?strategy=EQUAL" />


    <SERV codeServ = "Pivax" codeEnt = "utf8" callType="EXEC" url = "   

      http://iate.europa.eu" requete="php -f Robodico.PHP LS=$ls LC=$lc     

      lemme=$text"  />


  </SERVEURS>

<!-- LANGUES -->

  <LANGUE codeLG = "ZHO">


    <DICO codeServ = "Papillon" codeDico = "Cedict" nbrEntries = "215424"/>

  </LANGUE>

  <LANGUE codeLG = "ENG">


    <DICO codeServ = "Papillon" codeDico = "Cedict" nbrEntries = "107712"/>

    <DICO codeServ = "Papillon" codeDico = "DicoFulUS" nbrEntries =

      "9997"/>

    <DICO codeServ = "IATE" codeDico = "IATE" nbrEntries = "1282712"/>

  </LANGUE>

</RESSOURCES>

Comme présenté au IV.3.2, nous avons une petite configuration pour chaque sortie dédiée. Cette configuration permet de spécifier les préférences. Par exemple, pour SECTra, nous préférons utiliser xip comme outil de lemmatisation pour le français et l'anglais. Nous avons déjà montré un exemple dans la Figure 91.

2.          Spécification des entrées (0,25 p.)

Nous avons mentionné les entrées au IV.3, voici la spécification.

-CHA- text == (inDefaut = 'textIn').  ** -CHA- chaîne de caractères.

-EXC- output == (MS, GS, JSON, CCDX, DQ, etc.). ** excusive.

-EXC- detail == (0,1).

-EXC- lang == (zho, fra, eng, etc.).

-NEX- lc == (zho, fra, eng,etc.). **non excusive, 1 ou plusieurs.

-EXC- serv == (Pivax, Papillon, IATE, wiktionary, etc.).

-EXC- dico == (Papillon:Cedict, Papillon:JMDICT, Papillon:Littre, etc.).

-EXC- debut == (0,1).

-EXC- form == (0,1).

-EXC- lemmat == (Jieba, Ariane-Heloise, etc.). ** Outils dispon sur Lextoh.

3.          Spécification du langage CCDX (Common CreatDico Xml ) (2,25 p.)

Comme Lemmatix pour Lextoh, nous avons utilisé le langage CCDX (Common CreatDico Xml) pour uniformiser et informatiser les différentes sorties natives. Cela nous permet de simplifier les programmes pour construire une nouvelle sortie dédiée (mini-dictionnaire). On transforme d'abord les sorties natives vers les sorties en CCDX, puis on écrit des programmes simples (plugins) pour transformer les sorties en CCDX vers une sortie dédiée. Voici le fichier CCDX.DTD.

<!DOCTYPE CCDX [

<!ELEMENT CCDX (description, dictionnaires*)>

<!ELEMENT description (entree, lemmatiseur?)>

<!ELEMENT entree (#PCDATA)>

<!ELEMENT lemmatiseur (#PCDATA)>

<!ELEMENT dictionnaires (forme, dictionnaire*)>

<!ELEMENT forme (#PCDATA)>

<!ELEMENT dictionnaire (lemme, traductions*)>

<!ELEMENT lemme (#PCDATA)>

<!ELEMENT traductions (traduction*)>

<!ELEMENT traduction (mot-vedette, typeMot?, pronom?, domaine?, def?, pos?, fiab?, ref?, exemple?, commentaire?)>

<!ELEMENT mot-vedette (#PCDATA)>

<!ELEMENT typeMot (#PCDATA)>

<!ELEMENT pronom (#PCDATA)>

<!ELEMENT domaine (#PCDATA)>

<!ELEMENT def (#PCDATA)>

<!ELEMENT pos (#PCDATA)>

<!ELEMENT fiab (#PCDATA)>

<!ELEMENT ref (#PCDATA)>

<!ELEMENT exemple (#PCDATA)>

<!ELEMENT commentaire (#PCDATA)>

 

<!ATTLIST CCDX serv CDATA #REQUIRED>

<!ATTLIST CCDX dico CDATA #REQUIRED>

<!ATTLIST CCDX langueSource CDATA #REQUIRED>

<!ATTLIST entree type CDATA #REQUIRED>

<!ATTLIST traductions lang CDATA #REQUIRED>

]>

Voici un exemple de CCDX.

segment source = porte-bébé, langue source = fra, langues cibles = eng, esp, outil de lemmatisation = xelda, service dictionnairique = iate.

<?xml version="1.0" encoding="UTF-8"?>

<!DOCTYPE CCDX SYSTEM "CCDX.dtd">

<CCDX serv="iate" dico="iate" langueSource="fra">

    <description>

        <entree type="txt">porte-bébé</entree>

        <lemmatiseur>xelda</lemmatiseur>

    </description>

    <!--un forme pour un dictionnaire-->

    <dictionnaires>

        <forme>porte</forme>

        <!--un lemme pour un dictionnaire-->

        <dictionnaire>

            <lemme>porte</lemme>

            <!--les traductions d'une langue sont dans un élément « traductions »-->

            <traductions lang="eng">

                <!-- traduction -->

                <traduction>

                    <mot-vedette>door</mot-vedette>

                    <pos>NOUN</pos>

                    <fiab>3</fiab>

                    <ref_tra>The Land Rover Dictionary</ref_tra>

                </traduction>

                <traduction>

                    <mot-vedette>door</mot-vedette>

                    <domaine>Bâtiment et travaux publics</domaine>

                    <def>A building component consisting of an object in the form of a plate, the door leaf, normally equipped with a frame with which an opening for passage may be closed; normally the passage is shaped so as to accommodate persons in the upright position</def>

                    <ref_def>Ing.P.Lassen</ref_def>

                    <fiab>3</fiab>

                    <ref_tra>Ing.P.Lassen</ref_tra>

                    <commentaire>Door usually refers to a door leaf. The word doorset means door leaf plus door frame(S). Swedish and Danish make a difference between doors for normal traffic (persons) and doors for e.g. motor vehicle traffic etc. (see gate)</commentaire>

                </traduction>

                <traduction>

                    <mot-vedette>gateway</mot-vedette>

                    <fiab>3</fiab>

                    <ref_tra>Reg. 3381/94 (1) OJ L 367/94 p.104 Notice (2) OJ C 82/90 p.12</ref_tra>

                </traduction>

                <traduction>

                    <mot-vedette>gate</mot-vedette>

                    <def>a region in which the electric field due to the control gate voltage is effective</def>

                    <ref_def>IEV 521-7-9</ref_def>

                    <fiab>3</fiab>

                    <ref_tra>IEV 521-7-9</ref_tra>

                    <commentaire>of field-effect transistors; REF:IEV 521-7-9</commentaire>

                </traduction>

            </traductions>

            <traductions lang="spa">

                <traduction>

                    <mot-vedette>pasarela</mot-vedette>

                    ....

                </traduction>

                <traduction>

                    <mot-vedette>puerta</mot-vedette>

                    ....

                </traduction>

            </traductions>

        </dictionnaire>

        <!--autre lemme de porte-->

        <dictionnaire>

            <lemme>porter</lemme>

            <traductions lang="fra">

            ...

            </traductions>

            <traductions lang="spa">

            ...

            </traductions>

        </dictionnaire>

    </dictionnaires>

    <dictionnaires>

        <forme>bébé</forme>

        <traductions lang="eng">

            <traduction>

                <mot-vedette>baby</mot-vedette>

                ....

            </traduction>

        </traductions>

        <traductions lang="spa">

            ....

        </traductions>

    </dictionnaires>

</CCDX>

 

4.          Spécification des formats de sortie (1 p.)

a.          Sorties générales

Le système a trois formats pour les sorties générales : Json, Xml-CCDX et txt (chaîne de caractères). On peut aussi en utiliser deux supplémentaires si on a besoin d'informations détaillées. Au total, on a 5 types de sortie : texte-simple, texte-détaillé, Xml-CCDX (il n'existe pas de sortie "simple" pour ce format), Json-simple et Json-détaillé (pas encore réalisé).

On a déjà montré des exemples (interfaces) au IV.3.3.1.

La sortie en texte-simple est sous forme ci-dessous.

Lemme = LemmeSource Translation = Trans1(Lang) Trans2(Lang)

Souvent, la longueur des informations détaillées est très grande. On a décidé d'afficher la sortie en texte-détaillé en deux étapes. La première étape est des textes bruts sous la forme

Lemme = LemmeSource, part-of-speech de lemme = POS,

Translation = Trans1, langue de traduction = Lang1.

Voici les détaillées de traduction (en Xml).

La deuxième étape est le nœud Xml correspondant.

Voici un exemple pour la sortie en Json-simple.

Entrée : hello word

var JSONObject=[

{"serv":"wiktionary", "dico":"wiktionary", "lang":"eng", "lc":"fra&esp", "lemmat":"xip", "sortie":"JSON", "detail":"non"},

{"lemme":"hello", "translation"="bonjour", "langue"="fra"},

{"lemme":"hello", "translation"="salut", "langue"="fra"},

{"lemme":"hello", "translation"="allô", "langue"="fra"},

{"lemme":"hello", "translation"="hola", "langue"="esp"},

...

]

Pour les exemples de Xml-CCDX, voir la section précédente.

b.              Sorties dédiées

Les sorties dédiées (plugins) sont construites principalement par les utilisateurs, on en a montré un exemple pour SECTra au IV.3.2.1.

Nous présentons maintenant les contraintes techniques pour le développement des plugins.

5.          Contraintes techniques pour le développement  (0,5 p.)

En quel langage les plugins pour les sorties dédiées sont-ils écrits ? C'est souvent la première question posée par nos utilisateurs. Notre intergiciel est principalement construit en PHP. Les premiers mini-dictionnaires sont également construits en PHP.

En effet, la construction de mini-dictionnaires concerne principalement des transformations de données en Xml-CCDX vers un autre format demandé par le client, par exemple, le renommage des balises pour un nouveau XML. Pour cette partie, nous avons déjà expliqué au IV.3.3.2.2c.

Pour des raisons informatiques, on doit avoir un fichier PHP pour chaque sortie dédiée dans le répertoire préfixé : CreatDico/_Plugins/. L'entrée de ce fichier est une sortie générale (souvent Xml-CCDX) de CreatDico. La sortie de ce fichier est la sortie dédiée. Nous n'avons pas de contraintes spéciales pour utiliser tel ou tel langage  pour réaliser les spécifications.

Par exemple, nous pouvons écrire un programme python pour ces spécifications. Pour l'intégrer dans CreatDico, on procède en deux étapes : (1) créer le fichier PHP dans le répertoire préfixé, (2) appeler le programme python en utilisant le programme suivant.

//Entrée:$XML_CCDX

//Sortie:$n_sortie nouvelle sortie dédiée

$command = "python /home/ying/lingOutils/minidico/minidico_python.py $XML_CCDX ";

$n_sortie = exec($command);

return $n_sortie;

De la même façon, nous pouvons également réaliser les transformations par un service d'API. Comme Xml_CCDX est long, on a proposé de l'enregistrer dans un fichier. Notre fichier PHP de plugin sera similaire au programme suivant.

//Entrée:$XML_CCDX

//Sortie:$n_sortie nouvelle sortie dédiée

$file = fopen("temp_file.xml") or die ("Unable to open file");

fwrite($file, $XML_CCDX);

$url = "http://localhost/Ci-Hai/minidico_test/?Sortie_Orig=".urlencode($file);

$n_sortie = file_get_contents($url);

fclose($file);

return $n_sortie;

Dans nos intergiciels Lextoh et CreatDico, nous avons procédé de cette façon pour récupérer les résultats des différents services.

Par exemple,

·      dans Lextoh,

o   l'appel à Ariane-Héloïse est réalisé par un plugin appelant curl.

o   l'appel à Jieba est réalisé par un plugin écrit en Python.

·      dans CreatDico,

o   l'appel à Papillon est réalisé par un plugin contenant une commande de l'API.


 



[1] Alors respectivement chercheur postdoctoral au centre de recherche de NTT à Keihanna, attaché scientifique à l'Ambassade de France à Tokyo, et doctorante en linguistique computationnelle à Paris VI mais travaillant en fait au GETA-CLIPS à Grenoble.

[2] https://groups.google.com/forum/?hl=en#!forum/hownet, visité en 2015.

[3] Dans notre expérience, on peut envoyer le fichier entier dans une seule requête. Mais alors, il faut gérer les files d'attente du côté de Tradoh. Donc on délègue toutes les gestions de travaux à ActiveMQ, et on minimise les requêtes (c'est-à-dire que chaque requête peut être executé directement sur Tradoh).

[4] Ces sont les mêmes interfaces de JMS (Java Message Service). JMS est la technique sous jacente d'ActiveMQ.

[5] Ce format est un résultat de négociation, et est construit par l'application émettrice de SECTra. C'est le contenu du message. Par exemple,

String msg = segment+ "|zho|fra|Google|"+id_segment ;

TextMessage message = session.createTextMessage(msg);