題:
存在多少個獨特分子?有多少只通過合成而存在?
poshest
2014-10-01 19:38:57 UTC
view on stackexchange narkive permalink

我對

  • 在人類可以進入的世界中存在多少唯一個分子(所有類型:有機和無機等)感興趣排除黑洞和恆星中心等)?
  • 這些唯一類型的哪些子集僅由於人為合成而存在?

為簡化起見,忽略諸如具有不同原子同位素和不同鍵構型(例如順式,反式)的分子的變體。例如。標準水和“重水”都是$ \ ce {H2O} $,都算為一個。

我正在尋找理論上的估計,因此僅需要幾個數量級。我不在某些化學品的數據庫目錄中查找記錄數。

請解釋確定估算值的方法。 這真的沒有幫助

我什至無法想像如何為這個問題提供適當的答案。鑑於宇宙的廣闊以及我們實際上不知道的多少,再加上可能的多種化學環境,如果不作各種粗略的近似就很難回答這個問題。另外,“不同類型”是什麼意思?
定義“分子類型”。
您是說像“有機”,“無機”,“生物” ...嗎?
-1
@Wildcat對我的LordStryker示例有幫助嗎?有什麼不清楚的?
@AngusTheMan,否,不是分子的類別或一般組。請參閱我對LordStryker的評論。那有意義嗎?
@poshest,是$ \ ce {SiO2} $與$ \ ce {CO2} $類型相同的類型嗎?
@Wildcat號它們在計數中各為一。我認為我應該使用的詞是“獨特的”分子,而不是“獨特的”(對不起,來自數據庫背景)。
那麼@poshest,,我感覺到您的問題是關於具有不同分子式的分子的數量。我懷疑有人可以估計這一點。
我們可以問這個問題的動機是什麼?似乎您想對合成分子與所有分子進行估算。為什麼?好奇心還是其他?
@trb456是的,我正在寫一篇論文,並希望從一些數字入手,以便在介紹中提供觀點。令我感到困擾的是,網上沒有任何關於此的內容。但是jerepierre給了我密碼(搜索詞)“化學空間”
我傾向於估計超過9000。
根據術語“分子”和“唯一”的精確定義,答案可以是非常大的有限數或[可數無窮大](https://en.wikipedia.org/wiki/Countable_set),甚至[無窮無窮](https://en.wikipedia.org/wiki/Uncountable_set)。
答案可能是無數的(例如,更大的數量是可觀察宇宙中的粒子數量)。僅對於簡單的不飽和烴,僅50個碳,結構異構體的數目被認為超過10 ^ 22。那隻是兩種類型的原子,它們具有連通性限制。對於更多的原子類型,可能性的增長快於指數增長的速度。而且我們可以做更長的連鎖。
@SherlockHolmes-我更精確的估計是9001 ...
六 答案:
Jason Patterson
2014-10-01 22:14:51 UTC
view on stackexchange narkive permalink

聚合物或多或少使這個問題無法回答。

考慮人類1號染色體,該染色體包含大約249,000,000個鹼基對。沒有什麼能說我們不能以我們喜歡的任何方式訂購這些對,因此僅對於DNA而言,地球上每個人的數量都存在4 249000000 sup>個不同分子的可能性。包括諸如替代核苷酸(幾乎肯定至少有數千種這樣的核苷酸)和更長的鏈之類的東西,而且數目甚至更大,而且僅包括DNA(及其近親)。

沒有包含所有這些分子的真正方法,因為必須使用大量的方式將這些分子放在一起,而我們尚未發現。

有多少種?太多了,我們腦子裡只有幾個?幾乎所有這些粒子(畢竟,宇宙僅包含約10 80 sup>個粒子。

從理論上講,這是一個很好的解釋。我以同樣的方式思考DNA組合。至於現有的實際數字,您能獲得比“可怕的數字”更接近的精度嗎?知道那些僅因人造而存在的比例嗎?
我認為宇宙中的粒子數量非常不穩定。你知道,黑洞,黑塊和其他東西。
糟透了嗎?實際上,您的意思是無限的。聚合物的鍊長沒有上限,因此它們的數目本身是無限的。唯一真正的上限鍵是宇宙的大小和其中的原子數。
好吧,這給了我們一個合理的上限。每個原子彼此之間是否綁定在一起,因此我們正在研究劃分N = 10 ^ 80個元素的方法,即上限為Bell(10 ^ 80)= e ^(e ^(10 ^ 80)) 。但是,在這個宇宙中寫出這個數字是不可能的,因為它包含了10 ^ 80多個數字(!)。
@Greg如果我們要挑剔的話,它實際上並不是無限的,但是它將變得非常大。超過一定極限,分子的行為將受到重力的影響。使其足夠大,它將坍塌為恆星並開始聚變,破壞化學鍵。對於可以被視為單個分子的事物,您能做的最好的事情就是白矮星的質量上限。這將限制您的鍊長為大約10 ^ 57個原子。有很多方法可以安排這些,但不是無限的。我喜歡這個東西
@JasonPatterson您是正確的。這也是一種有趣的非化學上鍵。
jerepierre
2014-10-02 04:15:42 UTC
view on stackexchange narkive permalink

由於Jason Patterson給出的原因,對原子數/分子量沒有任何限制,可能的理論化合物的數量是無限的:您總是可以將聚合物再擴展一個單位。

據估計,有10 ^ 60種可能的分子量小於500的有機化合物。基於結構的藥物設計的技術和實踐:分子建模的觀點。 CAS可能有重複的,但它仍然是文獻中所有已知化合物的最佳數據庫,但並不全面。幾乎所有的CAS數據庫都是完全合成的。搜索分子量為<500的CAS條目可獲得61,026,438個命中,大約佔整個數據庫的一半。上面的參考文獻表明,生命可以存在幾千個小分子(即分子量為<500的化合物)。大自然產生的化合物遠比絕對最小值少得多,但是我希望我們只是摸索了外面的事物。

這應該使您了解我們正在談論的數量級。請記住,隨著MW < 500約束的放寬,數字將成倍增長。簡而言之,化學家們實際上合成了數百萬種不同的化合物,但與可能的可能性基本無關。

如果您想進一步了解這一領域,我建議您研究“化學空間”這一主題。

>

我認為將分子量分層是解決問題的好方法。誰估計10 ^ 60?如何?我沒有書,對不起。也為“化學空間” +1!神奇的搜索公式! :)
這有一些關於您的電話號碼的參考,還有很多其他的好東西http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3447393/
雷蒙德(在上面的鏈接中)建議使用10 ^ 60,但其他人也同意該數字可能在該範圍內。這些問題通常屬於化學信息學領域。
iad22agp
2014-10-01 21:02:28 UTC
view on stackexchange narkive permalink

根據化學文摘社,CAS REGISTRY(SM)包含超過9000萬種獨特的有機和無機化學物質,例如合金,配位化合物,礦物,混合物,聚合物和鹽,以及超過6500萬個序列,比同類任何其他數據庫都要多。它包括文獻中報導的可追溯到1800年代初期的物質,並且每天都會更新約15,000種物質。

CAS註冊中心不包括尚未考慮或發現的物質。它確實包含了您的五個示例。

這幾乎是我能想到的答案。

好吧,我特別要求不要提供“某些化學藥品數據庫目錄中的記錄數”,但我感謝您的回答。有什麼辦法知道組成完全非天然(合成)分子的CAS的比例嗎?
我認為天然存在的物質所佔的比例相對較小。我的推理:請注意,雖然自然界中存在許多物質,但自然界中沒有多少純淨的散裝形式存在。還應注意,“天然產物化學”是有機化學中處理生物體內產生的物質的專業。那裡還有許多尚未被發現的天然產物,但是這只是可能物質的一小部分。
Ellert van Koperen
2014-10-02 03:16:07 UTC
view on stackexchange narkive permalink

在我建立的當前可用合成化合物的數據庫中,有980萬種合成和天然化合物可供購買,另外還有2700萬種供應商認為可以在需要時生產的化合物。

明確地只包括可以通過繪製結構描述的純化合物,因此沒有混合物,也沒有DNA等只能猜測確切結構的東西。

我只包括大約30個值得信賴的供應商,並且請注意,這一組與CAS寄存器特別不同,因為該寄存器組被成千上萬的重複項和表示法變化嚴重污染。另外,很高興知道:幾乎所有供應商都在談論他們擁有的化合物的數量。

你建造的?幹得好!阿里巴巴的化學品。 :)這與商業數字有很大關係。知道什麼比例只能綜合存在嗎?
感謝您的讚美:-)天然化合物可以完全按照自然界合成,也可以從天然來源中濾除。儘管如此,這些只是全部可用化合物中的很小一部分。我手頭沒有一個數字,但我想說5%的上限是非常皇家的。在所有其他化合物中,大多數化合物可能是偶然的極少量存在於“野外”。因此,我們有一個下一個定義障礙:您何時宣布一種化合物本質上“存在”?如果你有一個分子?
你有鏈接嗎?它可以在線使用嗎?
很抱歉,該數據無法在線獲得。這些數據代表了許多也不免費的工作和工具。
AkiraAiren
2017-11-22 20:15:03 UTC
view on stackexchange narkive permalink

您不需要去聚合物。您已經可以在小分子領域(MW < 900 Da)中創建大量分子。因為當今大多數藥物都是小分子,所以這是一個有趣的領域。

這是到瑞士伯爾尼的一個研究小組的鏈接,該小組列舉了虛擬化合物並試圖將其分類為許多不同的類別。一種是綜合可用性。

這是他們解釋其工作的地方

這裡是他們提供的工具

有很多帶有精美可視化功能的工具。玩的開心。

wis
2015-11-24 16:24:40 UTC
view on stackexchange narkive permalink
  1. 選擇分子中原子數的上限。 (例如max_a = 500)
  2. 選擇要允許的原子元素(例如els = 1..92)
  3. 從els列表中選擇原子
  4. 該原子類型可以形成多少鍵(例如b_el1 = {2,3,4})
  5. 選擇這種情況下的鍵數(例如current_b = 3)
  6. 選擇下一個鍵號(第一次迭代中的bond_num = 1)
  7. 從els列表中選擇下一個附加原子,將其附加在當前鍵編號上
  8. 檢查附加原子的兼容性:鍵類型,電子有效,空間適合
  9. 如果通過所有測試,則需要附加。索引原子計數器+1。
  10. 如果未通過,則返回到步驟7。
  11. 如果通過,則返回到步驟6。
  12. 如果所有鍵都已滿,則返回到步驟7
  13. 如果原子計數器超過max_atoms,請停止
  14. 消除冗餘(等於termini-1的數量)
  15. ol>

    通過訪問反應相容性數據,該算法生成了可能達到選定極限的分子總數。並非為``窮舉搜索''過程提供所有詳細信息,例如跟踪所有分支以及如何處理雙鍵。但可以直接添加這些內容。 “設置限制”功能是必要的,以避免使計算機進入數以千計的數字運算。

這並不能真正回答這個問題,反正很難回答。另外,實際實現此算法比您想像的要困難得多。例如,“檢查附加原子的兼容性:鍵的類型,電子的有效性,空間適合性”是一項非常不瑣碎的任務,並且還有一個關於兼容性如何兼容的問題。
另外,該算法無法創建鈴聲。碰巧的是,環和稠環構成了大部分碳基天然化合物。


該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 3.0許可。
Loading...