Bonusové úkoly z bioinformatiky

Zde budou vypracované oba bonusové úkoly.

Úkol #1

Vypracovaný podle této stránky.

1.1What protein does the sequence come from?Odp:Z lidské Tyrosin-protein kinázy BTK1.2How many amino acid residues does the full-length protein contain?Odp:6591.3What kind of enzyme and what do they ‘do’?Odp:Kináza; kinázy jsou enzymy katalyzující fosforylaci, což je proces, při kterém je na substrát přenášen fosfát z ATP (nebo jiné podobné molekuly)1.4What is the common substrate of such enzymes?Odp:Často jiné proteiny (je-li myšleno toto; pokud je otázka cílená spíše na donory fosfátové skupiny, těmi jsou většinou molekuly ATP).1.5Which residues in the protein are involved in substrate binding?Odp:Jediná AK v aktivím místě je Asp. Inositol-(1,3,4,5)-tetrakisphosphate reaguje s Lys, Arg a Tyr.1.6How many and what are they called? [Domains]Odp:Pět domén: PH, zinkový prst, SH3, SH2 a protein kinázová doména.1.7How many structure models of this protein can you find in the structure database, i.e. the PDB (give also the names of the pdb entries)?Odp:Je jich celkem 69, čili vypisovat je nebudu.1.8What/which experimental methods have been used?Odp:Krystalografie a NMR.1.9What are these structural models representing? (Hint: this question is connected to questions 5 and 6).Odp:Většinou jsou to modely významných částí proteinu. Zobrazují jeho (domnělou) 3D strukturu.1.10How many members does this “Family” of domains have in the SCOP classification?Odp:V protein kinázové doméně.1.11How many members does this “Family” of domains have in the SCOP classification?Odp:Rodina “Protein kinases, catalytic subunit” má 63 různých domén.1.12What is the disease called?Odp:X-linked agammaglobulinemia (XLA).1.13In the above case, what is the molecular cause of the disease?Odp:Téhle otázce bohužel moc nerozumím. Zdravá a nezdravá sekvence se liší na mnoha místech, pinpointovat nějaké konkrétní, které by za nemoc mohlo, se mi nepodařilo. Když se podívám, jak by vypadala translace, z obou sekvencí vylezou zcela odlišné proteiny. Předpokládám ale, že správná odpověď bude ještě o něco komplikovanější.1.14How can such a mutation, R\(\rightarrow\)Q, look like on the genetic level?Odp:Napadá mě například nějaká chyba při translaci; kodon R je C-G-[ACGT], zatímco kodon Q je C-A-[AG]. Protože A i G jsou oba puriny, myslím, že nějaká chyba typu CGA \(\rightarrow\) CAA je možná.1.15What is the functional effect of the R524\(\rightarrow\)Q substitution? (An answer in general terms is OK but a detailed answer can be found in some databases).Odp:Taková substituce nějakým způsobem poškodí schopnost vázat ATP.

Úkol #2

Vypracovaný podle této stránky.

2.1How would you qualify the protein based on the secondary structure content? All-alpha? All-beta? or mixed alpha-beta?Odp:Protein je alfa-beta.2.2Can you guess how many domains does the structure contain? Are they most probably identical or different?Odp:Podle obrázku nejspíše dvě stejné domény (pokud ty samotné neberu jako rozdělené na více domén).2.3What does Ramachandran plot show? What are Psi and Phi?Odp:Ukazuje úhly na \(\ce{C\alpha}\) (peptidové vazby jsou planární). \(\psi\) a \(phi\) jsou názvy těch úhlů, konkrétně rotace kolem \(\ce{C-C}\) a \(\ce{C-N}\), respektive.2.4How many residues are outside three major allowed regions? What do the squares in the plot mean?Odp:Tři. Každý malý modrý čtverec značí naměřenou hodnotu \(\psi\) a \(\phi\) na jednom z \(\ce{C\alpha}\).2.5Judging from Ramachandran plot of our mysterious structure, does PrX look like a protein? Is it worth to further analyse it?Odp:Ano, přes 96% AK leží podle Ramachandranova diagramu na správném místě.2.6When was the DALI webpage last updated?Odp:Na linknuté stránce jsem tuto informaci nenašel.2.7When was the DALI Lite database last updated? What database is used by DALI?Odp:DALILite je discontinued, DALI používá celou PDB databázi.2.8Do you think DALI database is updated often enough?Odp:Zcela určitě.2.9When was the SSM webpage last updated? Who is the primary developer of the server?Odp:Pokud je namysli Fold, na který stránka odkazuje, byl naposledy updatován 8. 4. 2014. Hlavním správcem je EBI.2.10Which paper would give you more information about the SSM server?Odp:Nejspíše E. Krissinel and K. Henrick (2004). Secondary-structure matching (SSM).2.11How many different proteins are among the hits?Odp:24 hitů, z toho 2 a 2 byly na jednom proteinu—celkem tedy 22 různých proteinů.2.12What score is decisive for ordering the hits? What does it mean? Find the explanation for each column in the list.Odp:Q-score, které reprezentuje kvalitu alignmentu \(\ce{C\alpha}\). Kombinuje délku alignmentu (tj. počet matchnutých zbytků) a RMSD (tj. root mean square distance jednotlivých \(\ce{C\alpha}\)).2.13What is the sequence identity between 1PO6 and the query?Odp:65%.2.14What is the SSE identity between 1PO6 and the query?Odp:88% (konkrétně, 88% SS z PrX bylo indetifikováno v 1PO6, a 100% SS z 1PO6 bylo nalezeno v PrX).2.15How many hits with the DALI server? More or less than with SSM?Odp:Více, DALI našel 962 hitů.2.16How could you explain the different number of hits between the SSM and the DALI? What other factors could have played role?Odp:Pokud DALI nějakým způsobem zmenšuje vstupní databázi, může si nejspíše dovolit být trochu méně přísný co se vlastností hitů týče.2.17What is the most probable function of our mysterious protein?Odp:Jedná se nejspíše o nějaký heteroenní nukleární ribonukleoprotein, což je protein formující komplexy s RNA. Takové proteiny většinou figurují v procesech zahrnujících replikaci DNA, regulaci genové exprese apod.2.18Was Arg 97 built into the structure in a wrong way or are there objective reasons that make building of this residue difficult?Odp:Nemám tušení, Astex EDS viewer mi nefunguje v žádném z mých prohlížečů (Safari, Chrome, Firefox) a starý viewer vyžaduje starou verzi Javy, kterou mi prohlížeče odmítají spustit.2.19Which domain does occur in hnRNP core protein A1?Odp:Na 1PO6 se vyskytují dvě domény, RRM_1 a hnRNPA1. 2.20Does this domain interact with any other? Which?Odp:Pokud máte namysli hnRNPA1, ne. Pokud RRM_1, tak ano, a těch interakcí je 19. Jedna z nich je ale vskutku mago_nashi.2.21How many structures are known to contain a Mago nashi domain?Odp:Samotnou mago_nashi doménu má 1119 struktur.2.22What is the function of hnRNP core protein A1 according to the Uniprot?Odp:Uniprot říká doslova: Involved in the packaging of pre-mRNA into hnRNP particles, transport of poly(A) mRNA from the nucleus to the cytoplasm and may modulate splice site selection. May bind to specific miRNA hairpins. May play a role in HCV RNA replication.2.23How many residues are within hydrogen bonding distance? What amino acid types (hydrofobic, positively charged..) mediate the interaction?Odp:Podle PyMolu pouze tři AK: Gly (malá, nepolární \(\rightarrow\) hydrofobní), Phe (hydrofobní), Arg (kladně nabitý). Když se ale neomezím na 3,5Å, vidím H-můstků mnohem více.2.24Is it side chain or main chain that is responsible for the interaction between the amino acids and RNA?Odp:

Zdá se, že většinou interaguje s RNA boční řetězec.

Screenshot z PyMolu zobrazující interakci proeinu a RNA
2.25Which part of the nucleotide does mostly take part in the interaction?Odp:Většinou samozřejmě báze, i když se zdá, že někdy reaguje i ribóza.2.26Could there be also other types of interactions taking place?Odp:Ano, na určitých místech to vypadá, jako by docházelo ke stacking interakcím mezi bázemi nukelotidů a aromatickými AK.2.27Would you bet that our protein X could bind nucleic acid (please, motivate your answer)?Odp:Ano, dle Clustalu \(\Omega\) existuje jedna velká konzervovaná část, která je PrX i 1PO6 společná. Protože se jedná přibližně o celou první polovinu 1PO6, a dle PyMolu usuzuji, že právě tam se nachází AK interagující s RNA, dá se odhadnout, že by toho byl schopen i náš PrX.
⋅ 𝓔 ⋅