One Star

Problème avec la gestion de doublons de tUniqRow

Bonjour,
Je m'excuse d'avance de poster en français, mais je ne pense pas pouvoir expliquer mon problème en anglais.
Mon but premier est de traduire une requête en PL/SQL via Talend.
Je me retrouve dans une situation ou je suis connecté à plusieurs tables (23) d'une DB Oracle qui passent toutes par un tMap puis par un tUniqRow et enfin ressortent sur une nouvelle table de ma DB Oracle.
Mon problème est que lorsque j'applique mon tUniqRow sur mes 20 millions de lignes traités, je récupère le bon nombre de lignes en fonction d'un attribut de clé mais les dites lignes ne sont pas complétés entierement. Il me manque certaines informations bien que les lignes peuvent ne pas être complète dans certains cas. Est-il possible de supprimer les doublons via tUniqRow en gardant les lignes les plus complètes possibles ?? ou avez-vous une autre solution possible ??
Merci d'avance.

3 REPLIES
Community Manager

Re:Problème avec la gestion de doublons de tUniqRow

Hi Guy
Can you please post your question in English again?
Best regards
Shong

----------------------------------------------------------
Talend | Data Agility for Modern Business
One Star

Re:Problème avec la gestion de doublons de tUniqRow

Hello
Sorry for my bad english :s
My goal is to translate a query in PL / SQL using Talend.
I find myself in a situation where I'm connected to multiple tables (23) of Oracle DB all pass through one by one then tMap tUniqRow and finally emerge on a new table in my Oracle DB.
My problem is that when I apply my tUniqRow on my 20 million lines treated, I get the correct number of rows based on a key attribute but said lines are not fully completed. I miss some information that the lines may not be complete in some cases. Is it possible to delete the duplicates via tUniqRow keeping the lines as fully as possible?? or have you another solution possible?
Thank you in advance.

One Star

Re:Problème avec la gestion de doublons de tUniqRow

Problème résolu .
Il fallait subdiviser mon job en plusieurs sousjob et en fesant une premiere fois un insert avec ensuite des update de mes lignes déjà existante dans les sous jobs.