Added possibility to declare list of libraries needed to read friends info, extending...
[u/mrichter/AliRoot.git] / ANALYSIS / AliAnalysisAlien.h
1 #ifndef ALIANALYSISALIEN_H
2 #define ALIANALYSISALIEN_H
3 /* Copyright(c) 1998-1999, ALICE Experiment at CERN, All rights reserved. *
4  * See cxx source for full Copyright notice                               */
5
6 // Author: Mihaela Gheata, 01/09/2008
7
8 //==============================================================================
9 //   AliAnalysisAlien - AliEn utility class. Provides interface for creating
10 // a personalized JDL, finding and creating a dataset.
11 //==============================================================================
12
13 #ifndef ALIANALYSISGRID_H
14 #include "AliAnalysisGrid.h"
15 #endif
16
17 #ifndef ROOT_TString
18 #include <TString.h>
19 #endif
20
21 #ifndef ROOT_TMath
22 #include <TMath.h>
23 #endif
24
25 #ifndef ROOT_TMap
26 #include <TMap.h>
27 #endif
28
29 class AliAnalysisManager;
30 class AliAnalysisTaskCfg;
31 class TGridJDL;
32
33 class AliAnalysisAlien : public AliAnalysisGrid {
34
35 public:
36
37    AliAnalysisAlien();
38    AliAnalysisAlien(const char *name);
39    virtual ~AliAnalysisAlien();
40    AliAnalysisAlien(const AliAnalysisAlien& other); 
41    AliAnalysisAlien& operator=(const AliAnalysisAlien& other);
42 // Setters   
43    virtual void        AddAdditionalLibrary(const char *name);
44    virtual void        AddIncludePath(const char *path);
45    virtual void        AddRunNumber(Int_t run);
46    virtual void        AddRunNumber(const char *run);
47    virtual void        AddRunList(const char *runList);
48    virtual void        AddDataFile(const char *lfn);
49    virtual void        AddExternalPackage(const char *name);
50    virtual void        SetExecutable(const char *name="analysis.sh")     {fExecutable = name;}
51    virtual void        SetExecutableCommand(const char *command="root -b -q") {fExecutableCommand = command;}
52    virtual void        SetArguments(const char *name="")                 {fArguments = name;}
53    virtual void        SetExecutableArgs(const char *name="")            {fExecutableArgs = name;}
54    virtual void        SetAnalysisMacro(const char *name="myAnalysis.C") {fAnalysisMacro = name;}
55    virtual void        SetAnalysisSource(const char *name="myAnalysisClass.cxx") {fAnalysisSource = name;}
56    virtual void        SetValidationScript(const char *name="validation.sh") {fValidationScript = name;}
57    virtual void        SetAdditionalLibs(const char *list)               {fAdditionalLibs = list;}
58    virtual void        SetAdditionalRootLibs(const char *list)           {fAdditionalRootLibs = list;}
59    virtual void        SetPrice(Int_t price=1)                           {fPrice = price;}
60    virtual void        SetRunRange(Int_t min, Int_t max)                 {fRunRange[0] = min; fRunRange[1] = max;}
61    virtual void        SetJobTag(const char *tag="")                     {fJobTag = tag;}
62    virtual void        SetNrunsPerMaster(Int_t nruns=1)                  {fNrunsPerMaster = nruns;}
63    virtual void        SetMaxMergeFiles(Int_t nfiles)                    {fMaxMergeFiles = nfiles;}
64    virtual void        SetMaxMergeStages(Int_t nstages)                  {fMaxMergeStages = nstages;}
65    virtual void        SetSplitMode(const char *type="se")               {fSplitMode = type;}
66    virtual void        SetSplitMaxInputFileNumber(Int_t nfiles=100)      {fSplitMaxInputFileNumber = nfiles;}
67    virtual void        SetAPIVersion(const char *version)                {fAPIVersion = version;}
68    virtual void        SetROOTVersion(const char *version)               {fROOTVersion = version;}
69    virtual void        SetAliROOTVersion(const char *version)            {fAliROOTVersion=version;}
70    virtual void        SetUser(const char *user)                         {fUser = user;}
71    virtual void        SetTTL(Int_t ttl=30000)                           {fTTL = ttl;}
72    virtual void        SetGridWorkingDir(const char *name="workdir")     {fGridWorkingDir = name;}
73    virtual void        SetGridDataDir(const char *name)                  {fGridDataDir = name;}
74    virtual void        SetDataPattern(const char *pattern="*AliESDs.root") {fDataPattern = pattern;}
75    virtual void        SetFriendChainName(const char *name="", const char *libnames="");
76    virtual void        SetDefaultOutputs(Bool_t flag);
77    virtual void        SetGridOutputDir(const char *name="output")       {fGridOutputDir = name;}
78    virtual void        SetOutputArchive(const char *list="log_archive.zip:std*@disk=1 root_archive.zip:*.root@disk=2");
79    virtual void        SetOutputFiles(const char *list);
80    virtual void        SetOutputToRunNo(Int_t mode=1)                    {fOutputToRunNo = mode;}
81    virtual void        SetInputFormat(const char *format="xml-single")   {fInputFormat = format;}
82    virtual void        SetMaxInitFailed(Int_t nfail=5)                   {fMaxInitFailed = nfail;}
83    virtual void        SetTerminateFiles(const char *list)               {fTerminateFiles = list;}
84    virtual void        SetMergeExcludes(const char *list)                {fMergeExcludes = list;};
85    virtual void        SetMergeViaJDL(Bool_t on=kTRUE)                   {fMergeViaJDL = on ? 1 : 0;}
86    virtual void        SetMergeDirName(const char *name)                 {fMergeDirName = name;}
87    virtual void        SetMasterResubmitThreshold(Int_t percentage)      {fMasterResubmitThreshold = percentage;}
88    virtual void        SetNtestFiles(Int_t nfiles)                       {fNtestFiles = nfiles;}
89    virtual void        SetNumberOfReplicas(Int_t ncopies)                {fNreplicas = TMath::Min(ncopies,4);}
90    virtual void        SetJDLName(const char *name="analysis.jdl")       {fJDLName = name;}
91    virtual void        SetPreferedSE(const char *se);
92    virtual void        SetProductionMode(Int_t mode=1)                   {fProductionMode = mode;}
93    virtual void        SetRegisterExcludes(const char *list)             {fRegisterExcludes = list;}
94    virtual void        SetRunPrefix(const char *prefix);
95    virtual void        SetOutputSingleFolder(const char *folder)         {fOutputSingle = folder; fSplitMode="file"; fSplitMaxInputFileNumber=1;}
96    virtual void        SetFastReadOption(Bool_t on=kTRUE)                {fFastReadOption = on ? 1 : 0;}
97    virtual void        SetOverwriteMode(Bool_t on=kTRUE)                 {fOverwriteMode = on ? 1 : 0;}
98    virtual void        SetDropToShell(Bool_t drop=true)                  {fDropToShell = drop;}
99
100    TGridJDL           *GetGridJDL() const {return fGridJDL;}
101    TGridJDL           *GetMergingJDL() const {return fMergingJDL;}
102    const char         *GetGridOutputDir() const                          {return fGridOutputDir;}
103 //Utilities
104    void                AddModule(AliAnalysisTaskCfg *module);
105    void                AddModules(TObjArray *list);
106    AliAnalysisManager *CreateAnalysisManager(const char *name, const char *filename="");
107    Int_t               GetNmodules() const;
108    AliAnalysisTaskCfg *GetModule(const char *name);
109    Bool_t              LoadModules();
110    Bool_t              LoadFriendLibs() const;
111    Bool_t              GenerateTest(const char *name, const char *modname="");
112    Bool_t              GenerateTrain(const char *name);
113    virtual Bool_t      CreateDataset(const char *pattern);
114    Int_t               CopyLocalDataset(const char *griddir, const char *pattern, Int_t nfiles, const char *output="data.txt", const char *archivefile="", const char *outputdir="data");
115    virtual Bool_t      CreateJDL();
116    virtual void        EnablePackage(const char *package);
117    static Bool_t       DirectoryExists(const char *lfn);
118    static Bool_t       FileExists(const char *lfn);
119    static const char  *GetJobStatus(Int_t jobidstart, Int_t lastid, Int_t &nrunning, Int_t &nwaiting, Int_t &nerror, Int_t &ndone);
120    const char         *GetListOfFiles(const char *type);
121    Bool_t              CheckMergedFiles(const char *filename, const char *aliendir, Int_t nperchunk, const char *jdl="");
122    static AliAnalysisManager *LoadAnalysisManager(const char *fname);
123    static Bool_t       MergeInfo(const char *output, const char *collection);
124    static Bool_t       MergeOutput(const char *output, const char *basedir, Int_t nmaxmerge, Int_t stage=0);
125    virtual Bool_t      MergeOutputs();
126    virtual void        Print(Option_t *option="") const;
127    virtual Bool_t      StartAnalysis(Long64_t nentries=123456789, Long64_t firstentry=0);
128    static Bool_t       SetupPar(const char *package);
129    virtual Bool_t      Submit();
130    virtual Bool_t      SubmitMerging();
131    static Int_t        SubmitSingleJob(const char *query);
132    virtual void        WriteAnalysisFile();
133    virtual void        WriteAnalysisMacro();
134    virtual void        WriteMergingMacro();
135    virtual void        WriteMergeExecutable();
136    virtual void        WriteExecutable();
137    virtual Bool_t      WriteJDL(Bool_t copy);
138    virtual void        WriteProductionFile(const char *filename) const;
139    virtual void        WriteValidationScript(Bool_t merge=kFALSE);
140
141 // PROOF mode
142    virtual void        SetProofCluster(const char *cluster)              {fProofCluster = cluster;}
143    virtual void        SetProofDataSet(const char *dataset)              {fProofDataSet = dataset;}
144    virtual const char *GetProofDataSet() const                           {return fProofDataSet.Data();}
145    virtual void        SetProofParameter(const char *pname, const char *value);
146    const char         *GetProofParameter(const char *pname) const;
147    virtual void        SetProofReset(Int_t mode)                         {fProofReset = mode;}
148    virtual void        SetNproofWorkers(Int_t nworkers)                  {fNproofWorkers = nworkers;}
149    virtual void        SetNproofWorkersPerSlave(Int_t nworkers)          {fNproofWorkersPerSlave = nworkers;}
150    virtual void        SetRootVersionForProof(const char *version);
151    virtual void        SetAliRootMode(const char *mode)                  {fAliRootMode = mode;}
152    virtual void        SetProofProcessOpt(const char *proofOpt="")       {fProofProcessOpt = proofOpt;}
153    virtual TString     GetProofProcessOpt()                              {return fProofProcessOpt;}
154    // .txt file containing the list of files to be chained in test mode
155    virtual void        SetFileForTestMode(const char *filename)          {fFileForTestMode = filename;}
156    virtual TChain     *GetChainForTestMode(const char *treeName) const;
157    virtual const TString& GetGridJobIDs() const { return fGridJobIDs; }
158    virtual const TString& GetGridStages() const { return fGridStages; }
159 protected:
160    void                CdWork();
161    Bool_t              CheckInputData();
162    void                CheckDataType(const char *lfn, Bool_t &is_collection, Bool_t &is_xml, Bool_t &use_tags);
163    virtual Bool_t      Connect();
164    virtual void        SetDefaults();  
165    Bool_t              SubmitNext();
166
167    Bool_t              IsCollection(const char *lfn) const;
168    virtual Bool_t      IsSingleOutput() const;
169    Bool_t              IsUsingTags() const {return TObject::TestBit(AliAnalysisGrid::kUseTags);}
170    Bool_t              LoadModule(AliAnalysisTaskCfg *mod);
171    Bool_t              CheckDependencies();
172    Bool_t              CheckFileCopy(const char *alienpath);
173
174 private:
175    TGridJDL        *fGridJDL;         //! JDL maker
176    TGridJDL        *fMergingJDL;      //! JDL maker
177    Int_t            fPrice;           // Grid price for the job;
178    Int_t            fTTL;             // Time to live.
179    Int_t            fSplitMaxInputFileNumber; // Maximum number of files to be processed per subjob
180    Int_t            fMaxInitFailed;   // Maximum initial consecutive subjobs accepted to fail
181    Int_t            fMasterResubmitThreshold; // Failed jobs will be resubmitted until this DONE ratio
182    Int_t            fNtestFiles;      // Number of files used in the testing case
183    Int_t            fRunRange[2];     // Run range
184    Int_t            fNrunsPerMaster;  // Number of runs per masterjob
185    Int_t            fMaxMergeFiles;   // Maximum number of files to be merged in one chunk
186    Int_t            fMaxMergeStages;  // Maximum number of merging stages
187    Int_t            fNsubmitted;      // Number of jobs submitted
188    Int_t            fProductionMode;  // Production mode (0-off, 1-on)
189    Int_t            fOutputToRunNo;   // Use run number as output directory
190    Int_t            fMergeViaJDL;     // Enable merging via automatic JDL
191    Int_t            fFastReadOption;  // Use xrootd tweaks to reduce timeouts in file access
192    Int_t            fOverwriteMode;   // Overwrite existing files if any
193    Int_t            fNreplicas;       // Number of replicas for the output files
194    Int_t            fNproofWorkers;   // Number of workers in proof mode
195    Int_t            fNproofWorkersPerSlave; // Max number of workers per slave in proof mode
196    Int_t            fProofReset;      // Proof reset mode: 0=no reset, 1=soft, 2=hard
197    TString          fRunNumbers;      // List of runs to be processed
198    TString          fExecutable;      // Executable script for AliEn job
199    TString          fExecutableCommand;  // Command(s) to be executed in the executable script
200    TString          fArguments;       // Arguments for the executable script
201    TString          fExecutableArgs;  // arguments added to the executable script after the analysis macro
202    TString          fAnalysisMacro;   // Root macro steering the analysis
203    TString          fAnalysisSource;  // User analysis implementation (.cxx) file(s)
204    TString          fValidationScript; // Name of the validation script
205    TString          fAdditionalRootLibs;  // List (separated by blacs) of additional libraries needed for/before analysis libs/par file compilation
206    TString          fAdditionalLibs;  // List (separated by blacs) of additional libraries needed for the analysis loaded AFTER all par files
207    TString          fSplitMode;       // Job split mode
208    TString          fAPIVersion;      // API version
209    TString          fROOTVersion;     // ROOT version
210    TString          fAliROOTVersion;  // AliROOT version
211    TString          fExternalPackages; // External packages
212    TString          fUser;            // AliEn user name
213    TString          fGridWorkingDir;  // AliEn directory containing the input packages
214    TString          fGridDataDir;     // AliEn data production directory
215    TString          fDataPattern;     // Data pattern for 'find' command
216    TString          fGridOutputDir;   // AliEn directory (wrt work dir) where the output should be written
217    TString          fOutputArchive;   // List of output archives separated by blancs
218    TString          fOutputFiles;     // List of output files separated by blancs
219    TString          fInputFormat;     // Input format (xml-single)
220    TString          fDatasetName;     // Dataset xml file to be created
221    TString          fJDLName;         // JDL file to be generated
222    TString          fTerminateFiles;  // List of output files produced during Terminate
223    TString          fMergeExcludes;   // List of output files excluded from merging
224    TString          fRegisterExcludes; // List of liles not to be registered/merged
225    TString          fIncludePath;     // Include path
226    TString          fCloseSE;         // Preffered storage element. Taken from alien_CLOSE_SE environment.
227    TString          fFriendChainName; // File name to construct friend chain (for AOD)
228    TString          fJobTag;          // Job tag
229    TString          fOutputSingle;    // Directory name for the output when split is per file
230    TString          fRunPrefix;       // Run prefix to be applied to run numbers
231    TString          fProofCluster;    // Proof cluster name
232    TString          fProofDataSet;    // Proof dataset to be used
233    TString          fFileForTestMode; // .txt file for the chain to be used in PROOF test mode
234    TString          fAliRootMode;     // AliRoot mode among the list supported by the proof cluster
235    TString          fProofProcessOpt; // Option passed to proof process
236    TString          fMergeDirName;    // Name of the directory that should be added to the output directory
237    TObjArray       *fInputFiles;      // List of input files to be processed by the job
238    TObjArray       *fPackages;        // List of packages to be used
239    TObjArray       *fModules;         // List of AliAnalysisTaskCfg modules
240    TMap             fProofParam;      // Key-value pairs for proof mode
241    Bool_t           fDropToShell;     // If true, execute aliensh on start
242    TString          fGridJobIDs;      // List of last committed jobs
243    TString          fGridStages;      // List of last committed jobs
244    TString          fFriendLibs;      // List of libs (separated by blacs) needed for friends processing
245
246    ClassDef(AliAnalysisAlien, 24)   // Class providing some AliEn utilities
247 };
248 #endif