使用 EMRFS S3 最佳化的提交者 - Amazon EMR

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 EMRFS S3 最佳化的提交者

EMRFSS3 最佳化的提交者是一種替代OutputCommitter實作,可在使用時將檔案寫入 Amazon S3 進行最佳化。EMRFSEMRFSS3 最佳化的提交程式可避免在任務和任務提交階段在 Amazon S3 中執行的清單和重新命名操作,藉此改善應用程式效能。提交者可在 Amazon 5.19.0 及更高EMR版本中使用,並且在 Amazon EMR 5.20.0 及更高版本中預設啟用。提交者用於使用星火SQL, DataFrames或數據集星火作業。從 Amazon EMR 6.4.0 開始,此提交者可用於所有常見格式,ORC包括鑲木地板和文字格式 (包括CSV和)。JSON對於 Amazon EMR 6.4.0 之前的版本,僅支援實木複合地板格式。在某些情況下將不會使用遞交者。如需詳細資訊,請參閱EMRFSS3 最佳化提交者的需求