Tutorial HTCondor

Breve introduzione generale.

Francesco Prelz

INFN, sezione di Milano
Per conto del gruppo di lavoro Condor

Quiz

Che cosa
ha cominciato ad esistere più di trent'anni fa, ha prodotto sei major release e ha da non molto rilasciato la settima ?

Tanto tempo fa, in una galassia lontana lontana

GUERRE
STELLARIo forse no?

EPISODIO VIII
UNA NUOVA SPERANZA PER CONDOR

È un periodo di guerra civile fra fornitori di soluzioni per il calcolo distribuito.

Un gruppo di sviluppatori ribelli, lavorando in una base segreta, dopo innumerevoli battute d'arresto ha riportato qualche successo contro il malvagio Impero Grigliato.

Poca cosa se paragonati alla potenza di fuoco della MORTE NERA. Questo prezioso tutorial espone i piani di sviluppo sottratti dalla principessa Leia, noncurante dei biechi agenti dell'Impero. Essi possono salvare il suo popolo, risparmiare molti quattrini finora spesi in licenze e dare la libertà alla galassia...

Sommario

HTC, HPC e HTHPC (1)

high-throughput high-performance

HTC, HPC e HTHPC (2)

high-throughput high-performance

HTC, HPC e HTHPC (3)

high-throughput high-performance
FLOPY FLOPS

Sette princípi

  1. HTCondor gestisce i job
  2. HTCondor gestisce le macchine di esecuzione
  3. HTCondor gestisce i dati (per i job)
  4. HTCondor è scalabile e sicuro
  5. HTCondor utilizza la rete disponibile
  6. HTCondor gestisce workflow
  7. HTCondor può essere controllato ('monitored')

HTCondor gestisce i job

HTCondor gestisce le macchine

  • Il proprietario della macchina è sovrano (imperatore?).
    • Le policy del proprietario prevalgono su tutte le altre.
    • Il proprietario potrebbe non essere chi siede alla tastiera.
  • Al termine di ogni job ne viene cancellata ogni traccia.
  • Condor non deve essere in grado di abbattere la macchina.
  • Condor indaga e conosce le risorse della macchina.

HTCondor gestisce i dati

  • Non è obbligatorio avere un filesystem condiviso.
  • Le 'sandbox' dei job vengono trasferite.
  • I trasferimenti vengono gestiti ed accodati.
  • Condor conosce la dimensione delle 'sandbox'.
  • Sono possibili trasferimenti '3rd party'.

HTCondor è scalabile e sicuro

  • Il Central Manager è stateless e ragionevolmente leggero.
  • Lo stato viene conservato sempre alle estremità di ogni relazione.
  • Fatto scalare fino a 200000 job contemporaneamente in esecuzione.
  • Con supporto per: SSL, Kerberos, GSI, NTSPI, Host-based, password, CLAIMTOBE....
  • Utilizza le librerie locali a disposizione.
  • Sicurezza applicata alla singola sessione.

HTCondor utilizza la rete disponibile

HTCondor inoltre...

Grazie per l'attenzione.

Buon lavoro!